欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

搜狗輸入法全面AI化升級(jí),語(yǔ)音輸入能否開(kāi)啟交互新時(shí)代?

01-30 06:12
輸入法賽道正迎來(lái)AI驅(qū)動(dòng)的全新變革。

人工智能技術(shù)深度滲透各領(lǐng)域的當(dāng)下,作為基礎(chǔ)工具的輸入法也迎來(lái)了重做的契機(jī)。


1月27日,擁有6億日活躍用戶(hù)的搜狗輸入法正式宣布全面AI化。在近期更新的20.0 AI大版本中,AI語(yǔ)音、AI翻譯、AI打字三大核心模型均完成重要升級(jí)。


打字功能方面,新版本不僅大幅擴(kuò)充詞庫(kù)、強(qiáng)化用戶(hù)意圖與上下文理解能力,還針對(duì)醫(yī)生、律師等專(zhuān)業(yè)群體推出AI定制服務(wù),比如專(zhuān)業(yè)詞匯快速輸入、法律詞條及用藥說(shuō)明便捷查詢(xún)等。翻譯功能上,新版本支持30余種語(yǔ)言的輸入即譯,覆蓋文本與語(yǔ)音兩種輸入形式。


AI語(yǔ)音是此次升級(jí)的重點(diǎn)。依托自研AI語(yǔ)音大模型,新版本在語(yǔ)音識(shí)別流暢度、整體準(zhǔn)確率及方言識(shí)別精度上均有提升。同時(shí),新增“口語(yǔ)轉(zhuǎn)書(shū)面語(yǔ)”和易混音修改功能,針對(duì)語(yǔ)音輸入中常見(jiàn)的“他她它”“的地得”等易混音問(wèn)題,提供候選及替換方案。



語(yǔ)音輸入受到高度關(guān)注,源于其逐漸成為主流交互方式的趨勢(shì)。騰訊搜狗輸入法大模型產(chǎn)品負(fù)責(zé)人柴寶全在接受界面新聞采訪時(shí)透露,搜狗輸入法的AI用戶(hù)規(guī)模已突破1億,日均語(yǔ)音使用次數(shù)接近20億,且年輕用戶(hù)占比頗高。


語(yǔ)音輸入堪稱(chēng)互聯(lián)網(wǎng)輸入法誕生20年來(lái)最重要的交互革新。過(guò)去,語(yǔ)音輸入多作為輔助工具,在同音詞、語(yǔ)氣詞、方言識(shí)別等方面能力不足,用戶(hù)需頻繁手動(dòng)修改。而大語(yǔ)言模型的出現(xiàn),讓AI具備上下文理解能力,可主動(dòng)推測(cè)用戶(hù)輸入意圖,覆蓋日常使用乃至部分輕辦公場(chǎng)景。


海外已有不少成熟的語(yǔ)音輸入產(chǎn)品,如新加坡團(tuán)隊(duì)開(kāi)發(fā)的Typeless、硅谷創(chuàng)業(yè)公司打造的Wispr Flow,它們均以語(yǔ)音轉(zhuǎn)文字為核心功能,主要面向辦公人群,主打高效生產(chǎn)力場(chǎng)景。據(jù)介紹,Wispr Flow的輸入效率比手動(dòng)打字快3至4倍,能精準(zhǔn)識(shí)別并自動(dòng)編輯內(nèi)容,官方稱(chēng)80%的場(chǎng)景下用戶(hù)無(wú)需手動(dòng)修正。



國(guó)內(nèi)市場(chǎng)中,武漢一家創(chuàng)業(yè)公司推出的“閃電說(shuō)”也屬于同類(lèi)產(chǎn)品。這是一款優(yōu)先端側(cè)運(yùn)行的AI語(yǔ)音輸入法,通過(guò)本地語(yǔ)音模型實(shí)現(xiàn)毫秒級(jí)識(shí)別,可自動(dòng)理解語(yǔ)義、智能過(guò)濾口語(yǔ)化表達(dá),輸入速度比鍵盤(pán)快4倍,且因數(shù)據(jù)留存本地,能更好保障用戶(hù)隱私。


互聯(lián)網(wǎng)大廠也在積極布局語(yǔ)音輸入賽道。除搜狗輸入法外,微信官方的微信輸入法、字節(jié)跳動(dòng)的豆包輸入法,以及智譜AI推出的智譜AI輸入法,都將語(yǔ)音輸入作為核心競(jìng)爭(zhēng)標(biāo)簽。與采用SaaS模式的Wispr Flow不同,大廠的語(yǔ)音輸入功能更側(cè)重日常交流場(chǎng)景,憑借生態(tài)與流量?jī)?yōu)勢(shì),可實(shí)現(xiàn)自有生態(tài)內(nèi)的跨應(yīng)用聯(lián)動(dòng)體驗(yàn)。


作為互聯(lián)網(wǎng)基礎(chǔ)設(shè)施,輸入法重新受到各大公司重視,背后邏輯在于其是多數(shù)互聯(lián)網(wǎng)行為的起點(diǎn),通過(guò)高頻用戶(hù)互動(dòng)積累大量意圖數(shù)據(jù),且天然覆蓋各類(lèi)應(yīng)用。因此,輸入法也被視為AI Agent的雛形。此前騰訊曾嘗試將輸入法與AI搜索結(jié)合,發(fā)現(xiàn)用戶(hù)使用頻次顯著提升。


不過(guò),當(dāng)前語(yǔ)音輸入尚未發(fā)展到終極形態(tài)。柴寶全認(rèn)為,語(yǔ)音雖是重要輸入方式且會(huì)持續(xù)增長(zhǎng),但不能忽視打字的重要性。至少在硬件徹底革新前,打字仍是關(guān)鍵輸入能力。用戶(hù)的核心需求是獲得優(yōu)質(zhì)輸入結(jié)果,方式可靈活選擇,語(yǔ)音并非唯一選項(xiàng)。


“Wispr Flow算是完美形態(tài)嗎?未必。它還需要時(shí)間打磨?,F(xiàn)在很多AI編程場(chǎng)景不用鍵盤(pán),并非不需要,而是暫時(shí)沒(méi)有適配的優(yōu)質(zhì)鍵盤(pán)。所以輸入法的演變才剛進(jìn)入令人興奮的階段,遠(yuǎn)未達(dá)到僅靠麥克風(fēng)就能解決所有問(wèn)題的終極狀態(tài)?!辈駥毴硎?。


但語(yǔ)音輸入無(wú)疑值得探索。搜狗輸入法現(xiàn)階段主要圍繞“快”與“準(zhǔn)”優(yōu)化,比如針對(duì)安靜環(huán)境或駕駛等雙手不便的場(chǎng)景,新版本提升了輕聲輸入的識(shí)別準(zhǔn)確率。


“2011年至今可視為語(yǔ)音輸入上半場(chǎng),核心是‘所聽(tīng)即所得’。下半場(chǎng)語(yǔ)音輸入應(yīng)實(shí)現(xiàn)角色轉(zhuǎn)變,端到端滿(mǎn)足用戶(hù)的表達(dá)與創(chuàng)作需求,這是我們未來(lái)的努力方向?!辈駥毴f(shuō)道。


本文來(lái)自“界面新聞”,作者:陸柯言,編輯:文姝琪,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com