央視新聞客戶端報(bào)道 北京時(shí)間14日凌晨,OpenAI公司在美國加州舉辦新品發(fā)布會(huì),推出一款名為GPT-4o(歐)的人工智能模型。公司表示,新模型具備“聽、看、說”的出色本領(lǐng)。發(fā)布會(huì)上,OpenAI公司展示了新模型的多個(gè)應(yīng)用場景。
據(jù)介紹,GPT-4o(歐)的“o”源自拉丁語,意思是“全能”(字幕:omni,全能),新模型能夠處理50種不同的語言,提高了速度和質(zhì)量,并能夠讀取人的情緒。
新模型可以在最短232毫秒對音頻輸入做出反應(yīng),與人類在對話中的反應(yīng)時(shí)間相近。即使對話被打斷,新模型也可以做出自然反應(yīng)。這是此前人工智能語音聊天機(jī)器人做不到的。
圖像輸入方面,研究人員啟動(dòng)攝像頭,要求實(shí)時(shí)完成一道方程題,新模型輕松完成了任務(wù);研究人員還展示了它對一張氣溫圖表進(jìn)行實(shí)時(shí)解讀的能力。
OpenAI公司研究人員 巴雷特:ChatGPT,我正在和你分享這張圖表。你能否用非常簡短的一句話概括你所看到的?
人工智能模型GPT-4o:這張圖表顯示了2018年全年的平均、最低和最高溫度。一個(gè)明顯的注釋顯示,9月下旬曾下過一場大雨。
評論