The Information 報道,微軟正在開發一種名為MAI-1的新型人工智能大模型,該模型有可能與谷歌、Anthropic以及OpenAI的最先進模型相媲美。這意味著微軟自從向OpenAI投資超過100億美元尋求合作以來,首次自行研發如此規模的內部人工智能模型。而此前,OpenAI的GPT-4不僅為ChatGPT提供支持,也為Microsoft Copilot提供服務。
據說內部被稱為MAI-1的LLM預計最早將于本月首次亮相。MAI-1 的開發由前Google AI領導者Mustafa Suleyman負責,他最近擔任AI初創公司Inflection的首席執行官,之后微軟于今年3月以6.5 億美元收購了這家公司的大部分員工和知識產權。盡管MAI-1可能建立在前Inflection員工帶來的技術之上,但據報道認為,正如兩位熟悉該項目的微軟員工所證實的那樣,它是一種全新LLM。
MAI-1擁有大約5000億個參數,這將比微軟之前的開源模型Phi-3要大得多,需要更多的算力支撐和投喂數據。該模型初步可定位為介于GPT-3和GPT-4之間,這樣的配置在提供高響應精度的同時,其推理功率比OpenAI的旗艦LLM可低得多,且完全不同于Meta和 Mistral的700億參數等較小模型。
微軟可能會使用來自Inflection AI的訓練數據和之外的其他內容資產來為MAI-1提供訓練源,據說該模型的訓練數據集還包括包括GPT-4生成的文本和網頁內容。目前微軟正在使用配備Nvidia算力卡的“大型服務器集群”來進行開發過程。
盡管目前尚不清楚MAI-1的具體用途,如果該模型表現前景良好,微軟可能會在5月16日召開的 Build開發者大會上推出MAI-1。顯而易見的是,最理想的用途取決于首次登臺時的性能。