header-langage
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
掃碼下載APP

a16z: 預測市場走向爆炸性增長的關鍵是什麼?

2026-01-24 15:00
閱讀本文需 16 分鐘
针对预测市场的裁定难题,a16z 提出将 AI 模型锁定于区块链,以抗操纵的「数字法官」取代人工仲裁,推动市场从「人治」走向规模化的“算法法治”。
原文標題:How AI judges can scale prediction markets: The case for locking LLMs into the blockchain to resolve the hardest contracts
原文作者:Andrew Hall,a16z
原文編譯:佳歡,ChainCatcher


去年,委內瑞拉總統大選結果的預測市場交易額超過了 600 萬美元。但當計票結束時,市場面臨著一個不可能的局面:政府宣布尼古拉斯·馬杜羅獲勝;而反對派和國際觀察員則指控存在舞弊。預測市場的決議究竟應該遵循「官方資訊」(馬杜羅獲勝),還是「可信報導的共識」(反對派獲勝)?


在委內瑞拉選舉一案中,觀察員們的指控層層升級:他們先是譴責規則被無視、用戶資金『被竊』,進而痛斥該決議機制在這場政治博弈中獨攬大權——集『法官、陪審團和戮手』於一身,甚至直言其遭到了嚴重操縱。


這並非孤立的小插曲。這是我認為預測市場在規模化過程中面臨的最大瓶頸之一:合約裁決


這裡的風險極高。如果裁決處理得當,人們就會信任你的市場,願意在其中交易,價格也會成為對社會有意義的信號。如果裁決處理失當,交易就會讓人感到沮喪和不可預測。參與者可能會流失,流動性面臨枯竭的風險,價格也不再反映對穩定目標的準確預測。取而代之的是,價格開始反映出一種模糊的混合體——既包含結果發生的實際概率,也包含交易者對扭曲的決議機制將如何裁決的信念。


委內瑞拉的爭議相對高調,但在各個平台上,更隱蔽的失敗經常發生:


· 烏克蘭地圖操控案展示了對手如何直接通過博弈決議機制來獲利。一份關於領土控制權的合約規定,它將根據特定的線上地圖進行決議。據稱有人修改了該地圖以影響合約的結果。當你的「真理來源」可以被操縱時,你的市場也就能夠被操縱。


· 政府停擺合約展示了決議來源如何導致不準確或至少不可預測的結果。決議規則規定,市場將根據美國人事管理辦公室網站顯示停擺結束的時間進行賠付。特朗普總統在 11 月 12 日簽署了撥款法案——但由於不明原因,OPM 的網站直到 11 月 13 日才更新。那些正確預測停擺將在 12 日結束的交易者,因為網站管理員的延遲而輸掉了賭注。


· 澤連斯基西裝市場引發了關於利益衝突的擔憂。該合約詢問烏克蘭總統澤連斯基是否會在特定活動中穿西裝——這看似是一個微不足道的問題,卻吸引了超過 2 億美元的賭注。當澤連斯基穿著 BBC、《紐約郵報》和其他媒體描述為西裝的服裝出席北約峰會時,市場最初決議為「是」。但 UMA 代幣持有者對結果提出異議,決議隨後翻轉為「否」。


在這篇文章中,我將探討如何巧妙地結合大語言模型(LLMs)和加密技術,幫助我們創建一種難以操縱、準確、完全透明且具有可信中立性的預測市場大規模決議方式。


困擾不僅是在預測市場


類似的問題也一直困擾著金融市場。多年來,國際掉期與衍生工具協會(ISDA)一直在與信用違約互換(CDS)市場中的裁定難題進行博弈。所謂 CDS,即一種在公司或國家債務違約時進行賠付的合約。其 2024 年的審查報告對這些困難坦誠得令人矚目。他們的決議委員會由主要市場參與者組成,投票決定是否發生了信用事件。但這一過程因不透明、潛在的利益衝突和不一致的結果而受到批評,就像 UMA 的流程一樣。


根本問題是一樣的:當巨額資金取決於對模糊情況的判定時,每一個決議機制都會成為被博弈的目標,每一個模糊點都會成為潛在的爆發點。


理想裁定方案的四大支柱


任何可行的解決方案都需要同時實現幾個關鍵屬性:


1.抗操縱性

如果對手能夠影響裁定,比如通過編輯維基百科、植入假新聞、賄賂預言機或利用程式漏洞,市場就變成了一場較量誰更會操縱的遊戲,而不是誰更會預測。


2.合理的準確性

機制必須在大多數時候做出正確的裁定。在充滿真實模糊性的世界裡,完美的準確性是不可能的,但系統性錯誤或明顯的失誤會摧毀信譽。


3.事前透明度

交易者需要在下注前確切了解決議將如何進行。中途改變規則違反了平台與參與者之間的基本契約。


4.可信的中立性

参与者需要相信该机制不偏袒任何特定的交易者或结果。这就是为什么让持有大量 UMA 的人来决议他们已下注的合约是如此成问题:即使他们行事公正,利益冲突的表象也会破坏信任。


人工评审团可以滿足其中一些屬性,但在規模化時,他們很難做到其他幾點——尤其是抗操縱性和可信的中立性。像 UMA 這樣的基於代幣的投票系統,在巨鯨主導和利益衝突方面也有其自身被充分記錄的問題。


這就是 AI 以此為切入點的地方。


支持 LLM 法官的理由


這是在預測市場圈內獲得關注的一個提議:使用大語言模型作為決議法官,並在合約創建時將特定的模型和提示詞鎖定在區塊鏈上。


基本架構如下:在合約創建時,做市商不僅要用自然語言指定決議標準,還要指定確切的 LLM(由帶時間戳的模型版本標識)以及用於確定結果的確切提示詞(prompt)。


該規範被加密提交到區塊鏈上。當交易開啟時,參與者可以檢查完整的決議機制,他們確切地知道哪個 AI 模型將裁決結果,它將接收什麼提示詞,以及它能夠訪問哪些信息源。


如果他們不喜歡這個設定,他們就不交易。


在裁定時間,已提交的 LLM 使用已提交的提示詞運行,訪問指定的信息源,並生成判決。輸出結果決定誰獲得賠付。


這種方法同時解決了幾個關鍵約束:


· 極強地抵抗操縱(雖非絕對) 與維基百科頁面或小型新聞網站不同,你無法輕易編輯主流 LLM 的輸出。模型的權重在提交時是固定的。要操縱決議,對手需要破壞模型依賴的信息源,或者在很久以前以某種方式毒害模型的訓練數據,與賄賂預言機或編輯地圖相比,這兩種攻擊方式成本高昂且不確定性大。


· 提供準確性 隨著推理模型的迅速改進,並且能夠處理驚人的一系列智力任務,特別是當它們能夠瀏覽網絡並尋找新信息時,LLM 法官應該能夠準確地決議許多市場——了解其準確性的實驗正在進行中。


· 內建透明度 在任何人下注之前,整個決議機制都是可見且可審計的。沒有中途規則變更,沒有自由裁量的判斷,沒有密室談判。你確切地知道你簽署的是什麼。


· 顯著提高可信的中立性 LLM 在結果中沒有經濟利益。它不能被賄賂。它不擁有 UMA 代幣。它的偏見,無論是什麼,都是模型本身的屬性——而不是利益相關方做出的臨時決定的屬性。


AI 的局限性與防禦手段


· 模型會犯錯 LLM 可能會誤讀新聞文章,產生事實幻覺,或不一致地採用決議標準。但只要交易者知道他們是用哪個模型下注,他們就可以將這些缺陷計入價格。如果特定模型有已知的傾向以特定方式解決模棱兩可的案例,成熟的交易者會考慮到這一點。模型不需要完美;它需要是可預測的。


· 並非不可能操縱 如果提示詞指定了特定的新聞來源,對手可能會嘗試在這些來源中植入故事。這種攻擊對主流媒體來說很昂貴,但對較小的媒體來說可能是可行的——這是地圖編輯問題的另一種形式。提示詞的設計在這裡至關重要:依賴多樣化、冗余來源的決議機制比依賴單點故障的機制更穩健。


· 中毒攻擊在理論上是可能的 擁有足夠資源的對手可能會嘗試影響 LLM 的訓練數據,以此來偏向其未來的判斷。但這需要在合約之前很久就採取行動,且回報不確定,成本巨大——這比賄賂委員會成員的門檻要高得多。


· LLM 法官的擴散會產生協調問題 如果不同的市場創建者使用不同的提示詞致力於不同的 LLM,流動性就會分散。交易者無法輕易比較合約或彙總跨市場的信息。標準化是有價值的——但讓市場發現哪種 LLM 與提示詞的組合效果最好也是有價值的。正確的答案可能是某種組合:允許實驗發生,但建立機制讓社區隨著時間的推移收斂到經過充分測試的默認設置上。


給建立者的四條建議


總結來說:基於 AI 的裁定基本上是用一組問題(人類偏見、利益衝突、不透明)交換另一組問題(模型局限性、提示詞工程挑戰、信息源漏洞),而後一組問題可能更易於處理。那麼我們該如何推進?平台應該:


1. 實驗:

在較低風險的合約上測試 LLM 決議,以建立過往記錄。哪些模型表現最好?哪些提示詞結構最穩健?在實踐中會出現什麼故障模式?


2. 標準化:

隨著最佳實踐的出現,社區應致力於制定標準化的 LLM 與提示詞組合,作為默認設置。這並不排除創新,但有助於流動性集中在被充分理解的市場中。


3. 構建透明工具:

例如構建界面,使交易者在交易前容易檢查完整的決議機制——模型、提示詞、信息來源。決議規則不應被埋沒在細則中。


4. 進行持續治理:

即使有了 AI 法官,人類仍需負責頂層規則的制定:信任哪些模型,如何處理模型給出明顯錯誤答案的情況,何時更新默認設置。目標不是完全把人類從循環中移除,而是讓人類從臨時的逐案判斷轉向系統的規則制定。


預測市場擁有非凡的潛力,可以幫助我們理解一個嘈雜、複雜的世界。但這種潛力取決於信任,而信任取決於公平的合約決議。我們已經看到了決議機制失敗的後果:困惑、憤怒和交易者離場。我曾目睹人們在感到被一個似乎違背其下注精神的結果欺騙後,憤而完全退出預測市場——發誓不再使用他們以前喜歡的平台。這對於解鎖預測市場的利益和更廣泛的應用來說,是一個錯失的機會。


LLM 法官並不完美。但當它們與加密技術結合時,它們是透明的、中立的,並且能夠抵抗那些一直困擾人類系統的操縱。在一個預測市場規模化速度超過我們治理機制的世界裡,這可能正是我們所需要的。


原文連結


歡迎加入律動 BlockBeats 官方社群:

Telegram 訂閱群:https://t.me/theblockbeats

Telegram 交流群:https://t.me/BlockBeats_App

Twitter 官方帳號:https://twitter.com/BlockBeatsAsia

選擇文庫
新增文庫
取消
完成
新增文庫
僅自己可見
公開
保存
糾錯/舉報
提交