a16z crypto 領投,谷歌首席科學家 Jeff Dean、X 聯合創始人 Biz Stone 參投,Yupp 如何用衆包模式撕開 AI 普惠和評估的突破口?
撰文:KarenZ,Foresight News
隨着 AI 技術的飛速發展,AI 模型的層出不窮和多樣化讓用戶眼花繚亂。如何選擇適合自己的 AI 模型,除傳統基準測試外如何讓模型精準捕捉真實需求、如何爲反饋用戶提供實打實的激勵,成爲 AI 行業亟待突破的關鍵命題。
Yupp 正是在這一背景下誕生的開放型平台,旨在建立一個開放、透明、社區驅動的 AI 模型評估平台。正如 Yupp 所說,「與歷史上任何其他技術創新相比,AI 更依賴於每個人的參與和貢獻來推動進化。」
上周(6 月 13 日),Yupp.ai 宣布了 a16z crypto 領投的 3300 萬美元種子輪融資,同時谷歌首席科學家 Jeff Dean、X 聯合創始人 Biz Stone 等豪華投資人陣營吸引了社區的目光。與此同時,Yupp 還推出了其產品,不僅爲用戶提供了一個探索 AI 的窗口,更通過社區參與和區塊鏈技術重新定義了 AI 模型的評估與優化方式。
Gilad Mishne:Yupp 聯合創始人兼 AI 主管,曾在英特爾擔任過軟件工程師(1998 年 -2000 年),在雅虎擔任過高級科學家(2017-2010),在推特擔任過高級工程師和搜索總監(2010-2015),在谷歌擔任過高級工程經理和谷歌登月工廠機器學習主管(2019-2023)。
Jimmy Lin:Yupp 首席科學家,在麻省理工大學攻讀計算機科學博士期間研究問答系統和對話界面,目前在滑鐵盧大學 David R. Cheriton 計算機科學學院擔任教授和 David R. Cheriton 主席。2010 年至 2012 年, Jimmy Lin 在推特參與數據分析和數據科學的基礎設施建設。
值得一提的是,提問時模型默認自動選擇,有時還會隱藏掉模型名稱以收集更客觀的反饋,當然,用戶也可以隨機提問。此外,Yupp 的 QuickTake AI 功能還可以提供簡短總結回復。
2、用戶反饋:用戶在選出較優答案後,可以進一步通過點擊標籤反饋答案的優劣偏好,也可以用文字自由闡述。這些反饋將幫助用戶定制未來在 Yupp 上的 AI 答案,也讓 Yupp 能夠免費提供模型。
3、反饋獎勵:給出反饋後,用戶會得到一個積分刮刮卡。積分可用於提問或兌現。
4、評估:用戶通過選擇的最佳回復和提供的反饋,參與到模型的評估過程中。Yupp 旨在建立一個公開透明的評估體系,讓 AI 開發者可以獲取有價值的訓練數據,用戶可以獲得獎勵,共同推動 AI 技術的發展。Yupp 平台具有一個名爲「Yupp VIBE Score」(VIBE,Vibe Intelligence BEnchmark)的公開排行榜,旨在利用用戶反饋來改進模型性能,同時保證用戶 Prompt 的私密性,除非用戶選擇共享。
Yupp 會根據用戶反饋以及響應速度等因素制定一個排行榜。排行榜中,可以按過濾器對平台上集成的 AI 模型進行排序,維度包括 VIBE 評分、概率樣本的置信區間、投票情況、速度、延遲、輸入 / 輸出成本。
Yupp 的 AI 模型評估會結合用戶的偏好數據,以更細粒度的方式對用戶和評估數據進行細分,從而爲 AI 開發者提供樣本。Yupp 表示,憑藉團隊創始人在 Twitter 上應對垃圾信息和機器人問題的經驗,開發了復雜的算法來剔除低質量數據,確保排名的完整性。Yupp 還組建了專門的信任與安全團隊,並將繼續在該領域投入大量資金。
Yupp 積分體系:消耗與兌現的平衡規則
Yupp 積分靠提問消耗、靠反饋賺取,並且部分可以兌現。Yupp 表示,如果用戶負責任地使用 Yupp,將始終擁有足夠的積分提問 AI 模型,並且還可以兌現一部分積分,以表示對改善生態系統狀況的感激。
正如 a16z crypto 創始人和執行合夥人 Chris Dixon 表示,「Yupp 的設計將人類的判斷轉化爲可持續的經濟資源。隨着新的互動替代舊的數據,數據「過期」,形成了一個自然的良性循環:更多的使用帶來更新的評估;更新的評估產生更好的模型;更好的模型吸引更多的使用。所有參與者——從用戶到 AI 模型構建者——都可以參與其中,並看到相同的透明規則適用於每個人,確保了一個可信的中立市場。沒有人可以隱藏排行榜,也沒有人可以操縱獎勵或結果。」
Yupp 的口號「Every AI for everyone」,筆者認爲譯爲「普惠 AI」更爲貼切。Yupp 試圖通過區塊鏈技術與衆包模式,構建 AI 時代的「評估基礎設施」:讓用戶通過反饋獲得激勵,讓開發者獲取真實數據,最終推動 AI 技術向更普惠、更可信的方向進化。
Yupp 種子輪攬 3300 萬美元!推特前技術骨幹重構 AI 模型評估體系
撰文:KarenZ,Foresight News
隨着 AI 技術的飛速發展,AI 模型的層出不窮和多樣化讓用戶眼花繚亂。如何選擇適合自己的 AI 模型,除傳統基準測試外如何讓模型精準捕捉真實需求、如何爲反饋用戶提供實打實的激勵,成爲 AI 行業亟待突破的關鍵命題。
Yupp 正是在這一背景下誕生的開放型平台,旨在建立一個開放、透明、社區驅動的 AI 模型評估平台。正如 Yupp 所說,「與歷史上任何其他技術創新相比,AI 更依賴於每個人的參與和貢獻來推動進化。」
上周(6 月 13 日),Yupp.ai 宣布了 a16z crypto 領投的 3300 萬美元種子輪融資,同時谷歌首席科學家 Jeff Dean、X 聯合創始人 Biz Stone 等豪華投資人陣營吸引了社區的目光。與此同時,Yupp 還推出了其產品,不僅爲用戶提供了一個探索 AI 的窗口,更通過社區參與和區塊鏈技術重新定義了 AI 模型的評估與優化方式。
Yupp 團隊和融資背景
Yupp 背後公司爲 Ber Sarai Labs Inc.,由 Pankaj Gupta 和 Gilad Mishne 兩位聯合創始人於 2024 年 6 月共同創立,在過去 6 個月一直在祕密進行測試。Yupp 兩位聯合創始人和首席科學家於 2010 年在推特相識,均擁有深厚的 AI 行業背景,曾在 Coinbase、Google、X 等公司工作過。
本月 Yupp 官宣的 3300 萬種子輪融資已於去年完成。Yupp 資本矩陣覆蓋技術、投資與學術領域,除了領投方 a16z crypto 之外,谷歌首席科學家 Jeff Dean、X 聯合創始人 Biz Stone、Pinterest 聯合創始人 Evan Sharp、 Perplexity 首席執行官 Aravind Srinivas 、 Cred 首席執行官 Kunal Shah、斯坦福大學的四位教授(Dan Boneh、Chris Re、Nick McKeown、Balaji Prabhakar)、Othman Laraki、Paul Grewal、Gokul Rajaram 和 Coinbase Ventures 亦參與其中。
Yupp 是什麼?如何運作?
Yupp 定位爲 AI 模型探索和評估平台,允許用戶免費體驗和比較各種 AI 模型,其核心理念是通過衆包的方式進行模型評估:用戶提交提示詞,對比不同 AI 模型生成的回復,並給出較優答案和給出評定反饋,同時得到可兌現的積分激勵。這些選擇和反饋會被記錄下來,形成用於 AI 模型後期訓練和評估的數據。
Yupp 還將利用區塊鏈等開放訪問和無需許可的技術、零知識證明和挑戰 / 響應機制等密碼學原語和協議,以及機密計算等隱私保護技術,構建具有可證明的可信中立性、公平性和穩健性的系統。
Yupp 的運作機制可以概括爲以下幾點:
1、模型探索和對比:Yupp 匯集了超 500 個 AI 模型,包括 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等。用戶可以在平台聊天頁面找到各種 AI 模型,並進行 Prompt 測試,直觀並排比較它們的優劣。
Yupp 當前有聊天頁面和排行榜兩個頁面,其中,聊天頁面設計較爲簡單,有消息框、文件上傳功能、模型選擇功能(可選)、圖片上傳功能、聊天私密和公開模式切換(默認私密)。
如下圖所示,提問過後,Yupp 會給出兩個 AI 的回答版本,然後用戶選出較優版本。
值得一提的是,提問時模型默認自動選擇,有時還會隱藏掉模型名稱以收集更客觀的反饋,當然,用戶也可以隨機提問。此外,Yupp 的 QuickTake AI 功能還可以提供簡短總結回復。
2、用戶反饋:用戶在選出較優答案後,可以進一步通過點擊標籤反饋答案的優劣偏好,也可以用文字自由闡述。這些反饋將幫助用戶定制未來在 Yupp 上的 AI 答案,也讓 Yupp 能夠免費提供模型。
3、反饋獎勵:給出反饋後,用戶會得到一個積分刮刮卡。積分可用於提問或兌現。
4、評估:用戶通過選擇的最佳回復和提供的反饋,參與到模型的評估過程中。Yupp 旨在建立一個公開透明的評估體系,讓 AI 開發者可以獲取有價值的訓練數據,用戶可以獲得獎勵,共同推動 AI 技術的發展。Yupp 平台具有一個名爲「Yupp VIBE Score」(VIBE,Vibe Intelligence BEnchmark)的公開排行榜,旨在利用用戶反饋來改進模型性能,同時保證用戶 Prompt 的私密性,除非用戶選擇共享。
Yupp 會根據用戶反饋以及響應速度等因素制定一個排行榜。排行榜中,可以按過濾器對平台上集成的 AI 模型進行排序,維度包括 VIBE 評分、概率樣本的置信區間、投票情況、速度、延遲、輸入 / 輸出成本。
Yupp 的 AI 模型評估會結合用戶的偏好數據,以更細粒度的方式對用戶和評估數據進行細分,從而爲 AI 開發者提供樣本。Yupp 表示,憑藉團隊創始人在 Twitter 上應對垃圾信息和機器人問題的經驗,開發了復雜的算法來剔除低質量數據,確保排名的完整性。Yupp 還組建了專門的信任與安全團隊,並將繼續在該領域投入大量資金。
Yupp 積分體系:消耗與兌現的平衡規則
Yupp 積分靠提問消耗、靠反饋賺取,並且部分可以兌現。Yupp 表示,如果用戶負責任地使用 Yupp,將始終擁有足夠的積分提問 AI 模型,並且還可以兌現一部分積分,以表示對改善生態系統狀況的感激。
提問需要花費積分,初始註冊後可免費獲得 5000 積分。另外,總費用爲默認費用、PRO 模型費用、附件提交費用、預選圖片模型費用之和。
此外,Yupp 問答默認私密,如果用戶選擇公開問答,僅需支付上述常規費用的一半。
如前所述,反饋模型可以賺取積分刮刮卡。筆者得到的幾個積分刮刮卡在 200 到 500 積分之間。
Yupp 表示,用戶可以將積分提現,換成美元、歐元、印度盧比及其他 20 多種貨幣,或兌換成穩定幣(基於 Base 和 Solana)。Yupp 還與 Stripe、Paypal 和 Coinbase 等支付服務提供商建立了合作關係,以滿足用戶的不同需求。每 1000 積分可以兌換 1 美元。不過兌現功能目前不可用。爲了規避女巫或濫用行爲,Yupp 還設定了積分兌現規則:
另外,Yupp 規定,購買、出售、交易或轉讓 Yupp 積分等此類交易違反服務條款,均視爲無效,並可能導致帳戶立即停用。濫用可能會導致產品功能被禁用,甚至暫停帳戶。
如何參與?
Yupp 參與流程如下:
小結
正如 a16z crypto 創始人和執行合夥人 Chris Dixon 表示,「Yupp 的設計將人類的判斷轉化爲可持續的經濟資源。隨着新的互動替代舊的數據,數據「過期」,形成了一個自然的良性循環:更多的使用帶來更新的評估;更新的評估產生更好的模型;更好的模型吸引更多的使用。所有參與者——從用戶到 AI 模型構建者——都可以參與其中,並看到相同的透明規則適用於每個人,確保了一個可信的中立市場。沒有人可以隱藏排行榜,也沒有人可以操縱獎勵或結果。」
Yupp 的口號「Every AI for everyone」,筆者認爲譯爲「普惠 AI」更爲貼切。Yupp 試圖通過區塊鏈技術與衆包模式,構建 AI 時代的「評估基礎設施」:讓用戶通過反饋獲得激勵,讓開發者獲取真實數據,最終推動 AI 技術向更普惠、更可信的方向進化。