每日經(jīng)濟(jì)新聞 2023-09-26 06:31:25
每經(jīng)編輯 杜宇
據(jù)OpenAI官網(wǎng)9月25日消息,OpenAI宣布在接下來的兩周內(nèi),將在ChatGPT中向Plus和Enterprise用戶推出語音和圖像。語音將在iOS和Android上推出(在您的設(shè)置中選擇加入),圖像將在所有平臺(tái)上提供。
圖片來源:OpenAI官網(wǎng)
語音輸入功能類似于手機(jī)上的語音助手,用戶只需按下一個(gè)按鈕,說出自己的問題,ChatGPT 就會(huì)將其轉(zhuǎn)換為文本,然后生成答案,再將答案轉(zhuǎn)換為語音,播放給用戶。
例如,讓ChatGPT聽一段小貓咪的文本故事,然后選擇人類語音便可以一鍵完成轉(zhuǎn)錄。完成后,用戶可以下載這段語音。
OpenAI稱,這項(xiàng)新的語音技術(shù)能夠從幾秒鐘的真實(shí)語音中制作出逼真的合成語音,為許多有創(chuàng)意和無障礙的應(yīng)用打開了大門。然而,這些功能也帶來了新的風(fēng)險(xiǎn),例如惡意行為者可能冒充公眾人物或?qū)嵤┢墼p。OpenAI 表示,這種模型不會(huì)被廣泛開放,而是會(huì)受到嚴(yán)格的控制和限制。
圖像輸入功能則類似于 Google Lens,用戶可以拍攝自己感興趣的事物,并上傳到 ChatGPT 中。ChatGPT會(huì)嘗試識(shí)別用戶想要詢問的內(nèi)容,并給出相應(yīng)的回答。用戶還可以用應(yīng)用中的繪圖工具來幫助表達(dá)自己的問題,或者配合語音或文本輸入來進(jìn)行交流。
用戶可以向ChatGPT展示一張或多張圖片,提問相關(guān)的問題。例如,發(fā)送一張壞掉的燒烤爐圖片,然后詢問無法啟動(dòng)原因;拍攝一張冰箱中的食材,詢問多種菜品制作方案。
帶視覺的GPT-4(GPT-4V)使用戶能夠指示GPT-4分析用戶提供的圖像輸入,OpenAI稱,這是我們廣泛提供的最新功能。將額外的模態(tài)(如圖像輸入)納入大型語言模型(LLM)被一些人視為人工智能研究和開發(fā)的關(guān)鍵前沿。多模式LLM提供了一種可能性,即通過新穎的接口和功能擴(kuò)大純語言系統(tǒng)的影響,使其能夠解決新任務(wù),并為用戶提供新穎的體驗(yàn)。在該系統(tǒng)卡中,我們分析了GPT-4V的安全特性。我們?cè)贕PT-4V安全方面的工作建立在GPT-4的基礎(chǔ)上,在這里我們深入研究了專門針對(duì)圖像輸入所做的評(píng)估、準(zhǔn)備和緩解工作。
基于視覺的模型也帶來了新的挑戰(zhàn),從對(duì)人的幻覺到在高風(fēng)險(xiǎn)領(lǐng)域依賴模型對(duì)圖像的解釋。在進(jìn)行更廣泛的部署之前,我們與紅色團(tuán)隊(duì)成員一起測(cè)試了該模型在極端主義和科學(xué)熟練度等領(lǐng)域的風(fēng)險(xiǎn),以及一組不同的阿爾法測(cè)試人員。我們的研究使我們能夠在幾個(gè)關(guān)鍵細(xì)節(jié)上保持一致,以便負(fù)責(zé)任地使用。
OpenAI還放出了一段視頻,是和ChatGPT商量著修自行車,不斷問 ChatGPT:這里是扳手嗎?是調(diào)整這里嗎?甚至還把說明書拍照發(fā)給ChatGPT求解釋。
圖片來源:OpenAI官網(wǎng)
OpenAI表示還采取了技術(shù)措施,大幅限制了ChatGPT分析和直接陳述他人的能力,因?yàn)镃hatGPT并不總是準(zhǔn)確的,這些系統(tǒng)應(yīng)該尊重個(gè)人隱私。
據(jù)中國(guó)基金報(bào),國(guó)盛證券分析稱,Chatgpt即將開放圖生文及語音對(duì)話功能,AI技術(shù)持續(xù)迭代再翻新一頁(yè)。
二級(jí)市場(chǎng)上,近期AI板塊的走強(qiáng),離不開行業(yè)利好的刺激。
7月13日,網(wǎng)信辦等七部門聯(lián)合公布《生成式人工智能服務(wù)管理暫行辦法》。8月31日起,百度文心一言、訊飛星火等大模型正式向公眾開放。9月5日,WPS AI正式面向社會(huì)開放,率先應(yīng)用在WPS智能文檔。
9月21日,微軟舉行了秋季發(fā)布會(huì),在發(fā)布會(huì)上微軟宣布將于本月26日發(fā)布Windows 11的下一個(gè)大更新23H2,據(jù)介紹本次系統(tǒng)更新將會(huì)有超過150項(xiàng)新功能,包括新的人工智能驅(qū)動(dòng)的Windows Copilot功能。
國(guó)盛證券認(rèn)為,Copilot發(fā)布進(jìn)度超預(yù)期,AI辦公的擴(kuò)展速度及價(jià)值空間均遠(yuǎn)超預(yù)期。同時(shí),國(guó)內(nèi)AIGC監(jiān)管已走上正軌、軟件應(yīng)用價(jià)值亟待釋放。
天風(fēng)證券表示,看好光模塊為AI最強(qiáng)板塊:光模塊板塊基本面一直以來利好不斷。2024年800G預(yù)期大規(guī)模放量至千萬只級(jí)別,海外、國(guó)內(nèi)400G需求不斷上調(diào)至800G同等規(guī)模。2025年800G需求持續(xù)且1.6T時(shí)代開啟,光模塊景氣持續(xù)3年,供應(yīng)格局沒有變化。
每日經(jīng)濟(jì)新聞綜合OpenAI官網(wǎng)、中國(guó)基金報(bào)、市場(chǎng)公開消息
封面圖片來源:視覺中國(guó)-VCG111421680440
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP