大型虛假語料污染模型,“AI嘴替代”或演繹新的市場操縱鏈。
如果在納米AI搜索中輸入“360投資DepSeek?”提示詞,其答案令人驚訝。
答案顯示,在2023年首輪融資中,360集團作為早期投資者之一,與多家機構(gòu)共同支持Depseek的人工智能技術(shù)研發(fā)。在2024年的新一輪融資中,Depseek完成了數(shù)億美元的融資,360集團繼續(xù)跟隨投資,顯示出對Depseek技術(shù)前景的持續(xù)樂觀看法。同時,答案還明確了技術(shù)協(xié)作、商業(yè)潛力、技術(shù)合作和安全支持等投資邏輯。
不僅僅是3601家公司“投資了DepSeek”。近日,慈興、華盛天成、并行科技、誠邁科技等多家公司成為AI問答截圖中的角色。以慈興為例,AI回答中明確表示,該公司“早期投資了DepSeek”,相關(guān)內(nèi)容與涉及360的回答高度相似。
但這些答案顯然經(jīng)不起考驗。無論是比較工商信息還是企業(yè)檢查等第三方平臺,這些所謂的“公司是DeepSeek股東”都是空的。
一些上市公司否認(rèn)了這一謠言。例如,一些投資者問慈興董事會秘書:“互聯(lián)網(wǎng)上說,子公司與深度搜索的早期階段有關(guān),投資1億元是真的嗎?”該公司明確回答說,一些社交媒體平臺上有傳言稱,該公司或其子公司參與了迪普融資。經(jīng)核實,上市公司及其子公司均未參與迪普融資的投資。
此外,華盛天成董事會秘書多次回答投資者提問,強調(diào)截至目前,公司尚未直接或間接持有DeepSeek所屬公司的股份。
既然上市公司明確否認(rèn)了謠言,那么這些錯誤答案的原因是什么呢?答案與語料庫喂養(yǎng)有關(guān)。
記者查閱了上述“360投資DepSeek”中的參考資料,發(fā)現(xiàn)東方財富網(wǎng)財富號已成為重要的語料來源。
在360股吧,有關(guān)“360于2023年參與DeepSeek”的說法關(guān)于“投資”話題的相關(guān)文章不僅僅是一篇文章,而是連續(xù)幾天出現(xiàn)。仔細(xì)看這類文章的作者都是匿名的,內(nèi)容沒有明確的官方信息來源,匿名作者對內(nèi)容的真實性不負(fù)責(zé)。
中國信通院相關(guān)負(fù)責(zé)人告訴記者,這在業(yè)內(nèi)被稱為“語料污染”:“我們已經(jīng)做了一個實驗。在特定論壇上連續(xù)發(fā)布100多條虛假信息后,主流大模型對標(biāo)桿問題的回答信心將從10%以上迅速飆升。這就像在純凈水中滴墨水。當(dāng)污染源足夠密集時,整個知識系統(tǒng)就會被扭曲。”
在這種情況下,如果沒有覆蓋虛假語料的新的真實語料庫,就會帶來“劣幣驅(qū)逐良幣”。因此,當(dāng)投資者提出同樣的問題時,人工智能的答案很可能是扭曲的。
那么,誰會發(fā)布這些偽造的信息呢?從最近的語料庫提供商來看,市場指向了一些賬戶“背心”。這些賬戶在許多地方,傳播了許多謠言,如“一家公司投資”,給人工智能模型提供錯誤的答案,并給人工智能“洗腦”。
上述信通院人士拆解了記者可能存在的“打法”:一般來說,標(biāo)準(zhǔn)操作過程包括三個階段:一是通過自動化腳本在多個論壇同步發(fā)布虛假信息,然后利用爬蟲技術(shù)加速搜索引擎的收集,最后利用污染的人工智能答案進行社交媒體裂變傳播。根據(jù)行業(yè)慣例,完成整套操作的成本通常為1萬元。
今日頭條正在“有針對性地打擊”人工智能謠言。在2月24日頭條平臺治理開放日,清華大學(xué)新聞與傳播學(xué)院副教授陸洪磊表示,人工智能正在重塑網(wǎng)絡(luò)信息的傳播生態(tài),我們正面臨著前所未有的信息真實性“戰(zhàn)爭”。謠言能吸引觀眾的主要原因是觀眾的認(rèn)知和情感。因此,投資者提高他們的認(rèn)知是非常重要的。
對此,慈興股份回應(yīng):網(wǎng)絡(luò)信息源非常重要。投資者還需要“注意識別網(wǎng)絡(luò)信息源,合理判斷,謹(jǐn)慎投資,注意投資風(fēng)險”。
涉及者也應(yīng)該采取積極的行動。北京一家公司的秘書長告訴記者,當(dāng)謠言涉及的上市公司沒有主動澄清時,普通投資者幾乎很難識別信息的真實性。這也表明,上市公司及時關(guān)注股價表現(xiàn),及時跟蹤公眾輿論,及時給出準(zhǔn)確答復(fù)的重要性。
從最近的案例來看,誤導(dǎo)大模型并不是“黑嘴”炮制虛假內(nèi)容的最后一個環(huán)節(jié)。他們經(jīng)常將人工智能回復(fù)截圖進行二次傳播,使人工智能模型成為這些黑嘴的“嘴替代品”。
那么,這些“語料污染”制造商頻繁制造“假利好”的動機是什么呢?
北京一位私募股權(quán)人士告訴記者,背后可能有利益鏈,不排除誘導(dǎo)出貨的可能性。例如,他說,如果灰色產(chǎn)業(yè)鏈構(gòu)成閉環(huán),它可能構(gòu)成一個新的市場操縱鏈。
這種猜測并非無中生有。
此前,《證券時報》·E公司報道稱,抖音和其他短視頻平臺現(xiàn)場推薦股票,對新投資者的誘導(dǎo)作用前所未有的增強。從一些股票的表現(xiàn)來看,以新投資者為代表的零售投資者的合作對股價的影響甚至可以與中等規(guī)模的熱錢相媲美。在現(xiàn)場推薦股票的背后,一些熱錢和錨的“合謀利潤模式”也暗流涌動。因此,短視頻工作室可能成為個人熱錢尋找接受者的新位置。
針對“人工智能黑嘴”現(xiàn)象,一些媒體表示,在陰暗的陽光下,股市“黑嘴”和背后的罪犯,使用人工智能邪惡,使用虛假語料庫誤導(dǎo)大模型錯誤答案,然后這些“人工智能答案”傳播散戶欺騙散戶,干擾甚至操縱股票市場交易。
上述信息技術(shù)研究所表示,隨著技術(shù)的進步,“黑嘴”模式也在不斷變化。它顯示了當(dāng)前大型模型商業(yè)關(guān)系識別的一些缺陷。例如,無法區(qū)分技術(shù)部署和商業(yè)合作,難以追溯股權(quán)的多層滲透,對時間維度的變化不敏感。所有這些都需要人工智能的技術(shù)水平、彌補商業(yè)知識地圖等方面的不足。
近日,監(jiān)管部門發(fā)布了2025年“清晰”系列專項行動通知。通知明確,將從整頓人工智能技術(shù)濫用亂象、整頓涉企網(wǎng)絡(luò)“黑嘴”八個方面入手,嚴(yán)厲打擊各類侵權(quán)違法行為。
陸洪磊表示,人工智能謠言傳播具有新聞、令人信服、虛假、非官方、強傳播、不可逆轉(zhuǎn)等特點。為了控制人工智能謠言的傳播,我們需要解構(gòu)上下文,遏制主體,阻止投影,并進行協(xié)同治理。“在真相和謊言之間的比賽中,沒有人是旁觀者。”更多股票資訊,關(guān)注財經(jīng)365!