Yupp 種子輪攬 3300 萬美元!推特前技術骨幹重構 AI 模型評估體系

a16z crypto 領投,谷歌首席科學家 Jeff Dean、X 聯合創始人 Biz Stone 參投,Yupp 如何用衆包模式撕開 AI 普惠和評估的突破口?

撰文:KarenZ,Foresight News

隨着 AI 技術的飛速發展,AI 模型的層出不窮和多樣化讓用戶眼花繚亂。如何選擇適合自己的 AI 模型,除傳統基準測試外如何讓模型精準捕捉真實需求、如何爲反饋用戶提供實打實的激勵,成爲 AI 行業亟待突破的關鍵命題。

Yupp 正是在這一背景下誕生的開放型平台,旨在建立一個開放、透明、社區驅動的 AI 模型評估平台。正如 Yupp 所說,「與歷史上任何其他技術創新相比,AI 更依賴於每個人的參與和貢獻來推動進化。」

上周(6 月 13 日),Yupp.ai 宣布了 a16z crypto 領投的 3300 萬美元種子輪融資,同時谷歌首席科學家 Jeff Dean、X 聯合創始人 Biz Stone 等豪華投資人陣營吸引了社區的目光。與此同時,Yupp 還推出了其產品,不僅爲用戶提供了一個探索 AI 的窗口,更通過社區參與和區塊鏈技術重新定義了 AI 模型的評估與優化方式。

Yupp 團隊和融資背景

Yupp 背後公司爲 Ber Sarai Labs Inc.,由 Pankaj Gupta 和 Gilad Mishne 兩位聯合創始人於 2024 年 6 月共同創立,在過去 6 個月一直在祕密進行測試。Yupp 兩位聯合創始人和首席科學家於 2010 年在推特相識,均擁有深厚的 AI 行業背景,曾在 Coinbase、Google、X 等公司工作過。

  • Pankaj Gupta:Yupp 聯合創始人兼 CEO,擁有印度理工學院德裏分校計算機科學和工程學士學位、斯坦福大學大學計算機科學博士學位,曾在推特擔任過技術主管、個性化和推薦高級經理、ML 高級職員(2009 年 3 月 -2014 年 5 月),在谷歌先後擔任過工程總監和高級工程總監(2017 年 7 月 -2021 年 3 月),也曾擔任過 Coinbase India 一號員工和站點負責人,之後在 Coinbase 擔任過工程副總裁和顧問(2021 年 4 月 -2024 年 5 月)。
  • Gilad Mishne:Yupp 聯合創始人兼 AI 主管,曾在英特爾擔任過軟件工程師(1998 年 -2000 年),在雅虎擔任過高級科學家(2017-2010),在推特擔任過高級工程師和搜索總監(2010-2015),在谷歌擔任過高級工程經理和谷歌登月工廠機器學習主管(2019-2023)。
  • Jimmy Lin:Yupp 首席科學家,在麻省理工大學攻讀計算機科學博士期間研究問答系統和對話界面,目前在滑鐵盧大學 David R. Cheriton 計算機科學學院擔任教授和 David R. Cheriton 主席。2010 年至 2012 年, Jimmy Lin 在推特參與數據分析和數據科學的基礎設施建設。

本月 Yupp 官宣的 3300 萬種子輪融資已於去年完成。Yupp 資本矩陣覆蓋技術、投資與學術領域,除了領投方 a16z crypto 之外,谷歌首席科學家 Jeff Dean、X 聯合創始人 Biz Stone、Pinterest 聯合創始人 Evan Sharp、 Perplexity 首席執行官 Aravind Srinivas 、 Cred 首席執行官 Kunal Shah、斯坦福大學的四位教授(Dan Boneh、Chris Re、Nick McKeown、Balaji Prabhakar)、Othman Laraki、Paul Grewal、Gokul Rajaram 和 Coinbase Ventures 亦參與其中。

Yupp 是什麼?如何運作?

Yupp 定位爲 AI 模型探索和評估平台,允許用戶免費體驗和比較各種 AI 模型,其核心理念是通過衆包的方式進行模型評估:用戶提交提示詞,對比不同 AI 模型生成的回復,並給出較優答案和給出評定反饋,同時得到可兌現的積分激勵。這些選擇和反饋會被記錄下來,形成用於 AI 模型後期訓練和評估的數據。

Yupp 還將利用區塊鏈等開放訪問和無需許可的技術、零知識證明和挑戰 / 響應機制等密碼學原語和協議,以及機密計算等隱私保護技術,構建具有可證明的可信中立性、公平性和穩健性的系統。

Yupp 的運作機制可以概括爲以下幾點:

1、模型探索和對比:Yupp 匯集了超 500 個 AI 模型,包括 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等。用戶可以在平台聊天頁面找到各種 AI 模型,並進行 Prompt 測試,直觀並排比較它們的優劣。

Yupp 當前有聊天頁面和排行榜兩個頁面,其中,聊天頁面設計較爲簡單,有消息框、文件上傳功能、模型選擇功能(可選)、圖片上傳功能、聊天私密和公開模式切換(默認私密)。

如下圖所示,提問過後,Yupp 會給出兩個 AI 的回答版本,然後用戶選出較優版本。

值得一提的是,提問時模型默認自動選擇,有時還會隱藏掉模型名稱以收集更客觀的反饋,當然,用戶也可以隨機提問。此外,Yupp 的 QuickTake AI 功能還可以提供簡短總結回復。

2、用戶反饋:用戶在選出較優答案後,可以進一步通過點擊標籤反饋答案的優劣偏好,也可以用文字自由闡述。這些反饋將幫助用戶定制未來在 Yupp 上的 AI 答案,也讓 Yupp 能夠免費提供模型。

3、反饋獎勵:給出反饋後,用戶會得到一個積分刮刮卡。積分可用於提問或兌現。

4、評估:用戶通過選擇的最佳回復和提供的反饋,參與到模型的評估過程中。Yupp 旨在建立一個公開透明的評估體系,讓 AI 開發者可以獲取有價值的訓練數據,用戶可以獲得獎勵,共同推動 AI 技術的發展。Yupp 平台具有一個名爲「Yupp VIBE Score」(VIBE,Vibe Intelligence BEnchmark)的公開排行榜,旨在利用用戶反饋來改進模型性能,同時保證用戶 Prompt 的私密性,除非用戶選擇共享。

Yupp 會根據用戶反饋以及響應速度等因素制定一個排行榜。排行榜中,可以按過濾器對平台上集成的 AI 模型進行排序,維度包括 VIBE 評分、概率樣本的置信區間、投票情況、速度、延遲、輸入 / 輸出成本。

Yupp 的 AI 模型評估會結合用戶的偏好數據,以更細粒度的方式對用戶和評估數據進行細分,從而爲 AI 開發者提供樣本。Yupp 表示,憑藉團隊創始人在 Twitter 上應對垃圾信息和機器人問題的經驗,開發了復雜的算法來剔除低質量數據,確保排名的完整性。Yupp 還組建了專門的信任與安全團隊,並將繼續在該領域投入大量資金。

Yupp 積分體系:消耗與兌現的平衡規則

Yupp 積分靠提問消耗、靠反饋賺取,並且部分可以兌現。Yupp 表示,如果用戶負責任地使用 Yupp,將始終擁有足夠的積分提問 AI 模型,並且還可以兌現一部分積分,以表示對改善生態系統狀況的感激。

提問需要花費積分,初始註冊後可免費獲得 5000 積分。另外,總費用爲默認費用、PRO 模型費用、附件提交費用、預選圖片模型費用之和。

  • 基本費用: 每個提示詞默認花費 50 積分。如果生成圖像,則費用爲 100 Yupp 積分。
  • PRO 模型: 這些高級模型,僅在其他平台通過付費訂閱提供。如果用戶預先選擇 PRO 模型,則每次提問需額外花費 50 個 Yupp 積分。
  • MAX 模型: 這些模型是使用最昂貴的模型。如果用戶預先選擇 MAX 模型,則每個模型每個提示詞需額外花費 300 Yupp 積分(含基礎費用共計 350 積分)。
  • 附件提交費用:每個附件需要花費 25 個 Yupp 積分。
  • 選擇圖像模型: 每個預選圖像模型需額外花費 100 個 Yupp 積分。

此外,Yupp 問答默認私密,如果用戶選擇公開問答,僅需支付上述常規費用的一半。

如前所述,反饋模型可以賺取積分刮刮卡。筆者得到的幾個積分刮刮卡在 200 到 500 積分之間。

Yupp 表示,用戶可以將積分提現,換成美元、歐元、印度盧比及其他 20 多種貨幣,或兌換成穩定幣(基於 Base 和 Solana)。Yupp 還與 Stripe、Paypal 和 Coinbase 等支付服務提供商建立了合作關係,以滿足用戶的不同需求。每 1000 積分可以兌換 1 美元。不過兌現功能目前不可用。爲了規避女巫或濫用行爲,Yupp 還設定了積分兌現規則:

  • 每日提款次數最多 1 次,提款上限爲 10 美元(1 萬積分);
  • 每週提款次數最多 3 次,總提款上限爲 20 美元(2 萬積分);
  • 每月提款次數最多 6 次,總提款上限爲 50 美元(5 萬積分)。

另外,Yupp 規定,購買、出售、交易或轉讓 Yupp 積分等此類交易違反服務條款,均視爲無效,並可能導致帳戶立即停用。濫用可能會導致產品功能被禁用,甚至暫停帳戶。

如何參與?

Yupp 參與流程如下:

  • 用谷歌帳號登入註冊(註冊獲得 5000 積分,官方表示 6 月 20 日之前用「yupp-launch」code 可額外獲得 2500 積分);
  • 提問 AI 模型,在兩個 AI 模型中選擇較優答案;
  • 選擇反饋標籤或提供文字反饋。
  • 用鼠標刮積分刮刮卡領取積分。
  • 自行決定是否提款。

小結

正如 a16z crypto 創始人和執行合夥人 Chris Dixon 表示,「Yupp 的設計將人類的判斷轉化爲可持續的經濟資源。隨着新的互動替代舊的數據,數據「過期」,形成了一個自然的良性循環:更多的使用帶來更新的評估;更新的評估產生更好的模型;更好的模型吸引更多的使用。所有參與者——從用戶到 AI 模型構建者——都可以參與其中,並看到相同的透明規則適用於每個人,確保了一個可信的中立市場。沒有人可以隱藏排行榜,也沒有人可以操縱獎勵或結果。」

Yupp 的口號「Every AI for everyone」,筆者認爲譯爲「普惠 AI」更爲貼切。Yupp 試圖通過區塊鏈技術與衆包模式,構建 AI 時代的「評估基礎設施」:讓用戶通過反饋獲得激勵,讓開發者獲取真實數據,最終推動 AI 技術向更普惠、更可信的方向進化。

參考:

查看原文
本頁面內容僅供參考,非招攬或要約,也不提供投資、稅務或法律諮詢。詳見聲明了解更多風險披露。
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)