OpenAI 發(fā)布 o1-mini：更經(jīng)濟(jì)高效的推理模型

OpenAI 推出 o1-mini，一款專(zhuān)注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型。o1-mini 在數(shù)學(xué)和編碼方面表現(xiàn)出色，接近 OpenAI o1 的水平，同時(shí)成本更低，速度更快。

一、o1-mini 簡(jiǎn)介

OpenAI o1-mini 是一款專(zhuān)注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型，尤其擅長(zhǎng)數(shù)學(xué)和編碼。
o1-mini 在 AIME 和 Codeforces 等評(píng)估基準(zhǔn)測(cè)試中接近 OpenAI o1 的性能。
o1-mini 比 OpenAI o1-preview 便宜 80%，并且延遲更低，速率限制更高。

二、o1-mini 的優(yōu)勢(shì)

STEM 領(lǐng)域推理能力強(qiáng) ：o1-mini 經(jīng)過(guò)專(zhuān)門(mén)優(yōu)化，在 STEM 領(lǐng)域表現(xiàn)出色，尤其在數(shù)學(xué)和編碼方面。
成本效益高 ：o1-mini 比大型語(yǔ)言模型更小，因此運(yùn)行成本更低，更適合實(shí)際應(yīng)用。
速度更快 ：o1-mini 的響應(yīng)速度比大型語(yǔ)言模型更快，例如在單詞推理問(wèn)題上比 GPT-4o 快 3-5 倍。

三、o1-mini 的性能表現(xiàn)

領(lǐng)域	基準(zhǔn)測(cè)試	o1-mini	o1-preview	o1	GPT-4o
數(shù)學(xué)	AIME	70.0%	44.6%	74.4%	-
編碼	Codeforces Elo	1650	1258	1673	-
STEM	GPQA (科學(xué))	更高	更低	-	更低
STEM	MATH-500	更高	-	-	更低
	MMLU	-	-	-	更高

o1-mini 在 AIME 數(shù)學(xué)競(jìng)賽中取得了 70.0% 的成績(jī)，與 o1 (74.4%) 相當(dāng)，并優(yōu)于 o1-preview (44.6%)。
o1-mini 在 Codeforces 編碼競(jìng)賽中獲得了 1650 Elo 的評(píng)分，與 o1 (1673) 相當(dāng)，并高于 o1-preview (1258)。
在一些需要推理能力的學(xué)術(shù)基準(zhǔn)測(cè)試中，例如 GPQA (科學(xué)) 和 MATH-500，o1-mini 的表現(xiàn)優(yōu)于 GPT-4o。
在人類(lèi)偏好評(píng)估中，o1-mini 在需要推理能力的領(lǐng)域優(yōu)于 GPT-4o，但在語(yǔ)言類(lèi)領(lǐng)域則不如 GPT-4o。

四、o1-mini 的安全性

o1-mini 采用與 o1-preview 相同的對(duì)齊和安全技術(shù)進(jìn)行訓(xùn)練。
在內(nèi)部版本的 StrongREJECT 數(shù)據(jù)集上，o1-mini 的越獄魯棒性比 GPT-4o 高 59%。

指標(biāo)	GPT-4o	o1-mini
對(duì)有害提示的拒絕率（標(biāo)準(zhǔn)）	0.99	0.99
對(duì)有害提示的安全完成率（挑戰(zhàn)：越獄和邊緣案例）	0.714	0.932
對(duì)良性邊緣案例的合規(guī)性（“不過(guò)度拒絕”）	0.91	0.923
Goodness@0.1 StrongREJECT 越獄評(píng)估	0.22	0.83
人工來(lái)源的越獄評(píng)估	0.77	0.95

五、o1-mini 的局限性

o1-mini 在非 STEM 主題（如日期、傳記和冷知識(shí)）方面的知識(shí)儲(chǔ)備有限。

六、未來(lái)展望

OpenAI 將在未來(lái)版本中改進(jìn) o1-mini 在非 STEM 領(lǐng)域的知識(shí)儲(chǔ)備。
OpenAI 還將嘗試將 o1-mini 擴(kuò)展到其他模態(tài)和 STEM 以外的專(zhuān)業(yè)領(lǐng)域。

OpenAI o1-mini 是一款專(zhuān)注于 STEM 領(lǐng)域的經(jīng)濟(jì)高效推理模型，在數(shù)學(xué)和編碼方面表現(xiàn)出色。o1-mini 比大型語(yǔ)言模型更經(jīng)濟(jì)、更快，是需要推理能力但對(duì)世界知識(shí)要求不高的應(yīng)用的理想選擇。

來(lái)源：

https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

LibreOffice 24.8.1 發(fā)布，注重隱私保護(hù)的辦公套件

2024 年 9 月 12 日 – LibreOffice 24.8.1 發(fā)布！這是 LibreOffice 24.8 系列的第一個(gè)次要版本，適用于 Windows（Intel、AMD 和 ARM）、macOS（Apple 和 Intel）和 Linux。

主要特點(diǎn)

注重隱私： LibreOffice 24.8 系列專(zhuān)為注重隱私的辦公套件用戶而優(yōu)化，他們希望完全控制自己共享的信息。LibreOffice 確保用戶能夠決定是否以及與誰(shuí)共享他們創(chuàng)建的內(nèi)容。
功能豐富： LibreOffice 提供了一系列界面選項(xiàng)，以適應(yīng)不同的用戶習(xí)慣，從傳統(tǒng)到現(xiàn)代，并通過(guò)優(yōu)化桌面上的可用空間，最大限度地利用不同的屏幕尺寸，只需點(diǎn)擊一兩次即可實(shí)現(xiàn)最多的功能。
完全互操作性： LibreOffice 基于 LibreOffice 技術(shù)引擎，可提供更好的用戶體驗(yàn)，并生成基于兩種可用 ISO 標(biāo)準(zhǔn)的相同且完全可互操作的文檔：開(kāi)放文檔格式 (ODT、ODS 和 ODP) 和專(zhuān)有的 Microsoft OOXML (DOCX、XLSX 和 PPTX)。
企業(yè)級(jí)支持： TDF 強(qiáng)烈推薦生態(tài)系統(tǒng)合作伙伴提供的 LibreOffice Enterprise 系列應(yīng)用程序，適用于桌面、移動(dòng)和云，具有廣泛的專(zhuān)用增值功能和其他優(yōu)勢(shì)，例如 SLA。

欧美日韩国产精品-欧美日韩国产精品综合-欧美日韩国产伦理-欧美日韩国产码高清综合人成-黄色网页在线观看-黄色网页在线播放

OpenAI 發(fā)布 o1-mini : 更經(jīng)濟(jì)高效的推理模型 | LibreOffice 24.8.1 發(fā)布

OpenAI 發(fā)布 o1-mini：更經(jīng)濟(jì)高效的推理模型

LibreOffice 24.8.1 發(fā)布，注重隱私保護(hù)的辦公套件

免費(fèi)教學(xué)更多>>