(JY編譯)新型生成式AI集成到各自的搜索引擎中,「聊天機器人」成為新的科技行業生產力工具,微軟和谷歌試圖在展示人工智能驅動的搜索的早期版本中相互較量;微軟表示,在上周其New Bing推出最初的48小時內,有超過100萬人註冊試用該新一代AI驅動搜索引擎。
微軟首席執行官薩蒂亞‧納德拉(Satya Nadella)告訴《CNBC》新聞,這項技術可以輸出完整的答案,讀起來就像人類寫的一樣,「也許是發生在知識型工作領域的工業革命」。
但是對於那些關心答案的準確性的人來說,人工智能還有很多不足之處。
微軟在記者面前的演示中,嵌入該公司必應搜索引擎(Bing)的類似ChatGPT的技術分析了來自Gap和Lululemon的財報。在將其答案與實際報告進行比較時,聊天機器人漏掉了一些數字。還有一些數字似乎是編造的。
獨立搜索研究員德米特里-布雷頓(Dmitri Brereton)週一在Substack帖子中寫道︰「Bing AI在演示中,回答的一些答案存在明顯的事實偏差。但沒有人注意到。相反,每個人都急著跳上了 Bing 炒作列車。」
布雷頓指出,除了財務錯誤之外,微軟演示中關於吸塵器規格和前往墨西哥的旅行計劃的答復中可能存在事實問題。他告訴《CNBC》新聞,他最初並沒有想著找出錯誤,只是在他更仔細地觀察以比較微軟和谷歌的人工智能發佈時才發現一些錯誤。
人工智能專家稱這種現象為「幻覺」(hallucination),或者說基於大型語言模型的工具有簡單製造東西的傾向。上週,谷歌推出了一個競爭性的人工智能工具,其中也有事實性錯誤,只是這些錯誤很快就被觀眾指出來。
OpenAI在去年11月向公眾推出ChatGPT後,微軟和谷歌都於將新型生成式人工智能納入搜索引擎,並急於展示其在ChatGPT爆炸式增長後展示自己的進展。
OpenAI已經從微軟那裡獲得了數十億美元的融資,而像Stability AI和Hugging Face這樣的競爭性初創公司也在私人融資中估值也飆升至10億美元。
雖然谷歌一直不願意在搜索引擎中加入人工智能生成的回复,並以聲譽風險和安全問題為由,但微軟在上週的公告中強調了向部分公眾釋放該技術的短期潛力。
納德拉說︰「我認為重要的是不要待在實驗室裡。你必須把這些東西安全地拿出來。」
當天,微軟的營銷主管尤素福‧邁赫迪(Yusuf Mehdi)瀏覽了Gap的投資者關係網站,並要求Bing AI總結該零售商去年11月發布的第三季度財報中的「關鍵業績」。邁赫迪還說︰「非常酷。節省了大量的時間。」
在演示Bing AI對企業盈利問題的回答時,出現了一些問題。以下是布雷頓發現了Bing AI的一些錯誤︰
- Gap Inc. 報告的毛利率為37.4%。但在排除與Yeezy Gap有關的費用後,調整後的毛利率為38.7%。
- Gap的營業利潤率為4.6%,而不是Bing AI 給出的5.9%,這個數字在該公司的報告中沒有出現過。
- 調整後的攤薄每股收益為0.71美元,而不是Bing AI說的0.42美元,這個數字也沒有出現在文件中。 Gap報告的數字包括調整後的所得稅收益約0.33美元。
- Gap公司在8月份撤消了其全年展望,並在第三季度報告中說,「第四季度的淨銷售額可能會同比下降個位數」。這將意味著全年的收入將下降,而不是Bing AI指的「低兩位數的增長」。
而且布雷頓沒有看到任何關於營業利潤率或每股收益的未來前景的任何內容,但Bing AI卻對此進行預測。
微軟表示,其知道這些錯誤,它預計Bing AI會犯錯誤。
微軟發言人告訴《CNBC》新聞︰「我們知道這份報告,並且已經分析了這些錯誤,努力改善這種體驗。我們認識到仍有工作要做,並預計系統可能會在此預覽期間出錯,這就是為什麼反饋至關重要,以便我們能夠學習並幫助模型變得更好。」
在發佈會上,微軟副總裁優素福·馬赫迪(Yusuf Mehdi)隨後要求Bing AI將Gap的收益與Lululemon的報告進行比較。邁赫迪希望Bing AI把這兩份報告中的信息整合到一個表格中。
馬赫迪更直言︰「看看這有多神奇。就這樣,在一個表中,我可以得到這個問題的答案。想想看,如果不是這樣的話,這得花多少時間。」
表中有幾個錯誤,首先是利潤率。Lululemon的毛利率是55.9%,而不是Bing AI給出的58.7%。
該公司的營業利潤率為19%,而不是Bing AI提到20.7%。另外,Lululemon報告的攤薄後每股收益為2美元,調整後每股收益為1.62美元。 Bing AI顯示攤薄後為1.65美元。
此外,Gap有6.79億美元的現金和現金等價物,而不是Bing AI給出的14億美元。以及Gap有30.4億美元的庫存,而不是Bing AI提供的19億美元。
Photo by Rubaitul Azad on unsplash