用AI一鍵搞定雅思口語 | 釦子coze.cn最佳實踐 Vol.1
☑️Bot現已開源,一鍵複製創造屬於你的24小時口語專家
掃碼體驗/復刻雅思口語專家
提到備考雅思
第一反應是不是擼起袖子報個班?
等等打住!
現在流行的“電子專家”不會還有人不知道吧?
全能專家助你雅思保7爭8,輕鬆拿捏!
還能1V1口語陪練,免費的啊!!!
沒有語言環境,那就自己創造!
---嚴肅分割線---下面,讓我們帶你五步搭建你的 AI 口語產品!
Step 1:明確產品價值
經過與夥伴的深入討論,我們明確了雅思 AI 口語陪練產品的市場價值:
1. 明確市場價值
用戶畫像高度重合
雅思考試市場年規模可達數十億元人民幣,包含報名費、培訓費等。
用戶驅動力強
雅思考生具有強烈的自我驅動力,對新產品接受度高。
用戶痛點明顯口語是中國考生的主要難點,缺乏語言環境尤爲不利;
口語能力對申請出國留學的學生來說是面試成功的關鍵因素之一。
訓練場景高留存率
雅思口語的訓練場景有短期高頻的需求,題庫難度要求考生至少預留一週以上準備時間。
產品迭代增量可控
每年1月、5月、9月更新,新增內容佔30%,替換70%;
Part 1題庫包括30-50道題,Part 2和Part 3的題庫涵蓋50-60道題。
2. 明確可實現性
基於對大模型的瞭解,口語陪練產品與大模型能力高度契合。語言訓練非常符合Transformer架構的特性,是其最佳實踐之一。
Step 2:明確產品功能框架
爲了做一款針對雅思口語訓練的AI產品,我們首先需要明確雅思口語的考試結構&備考方式:
考試結構
Part1(4-5分鐘): 日常口語交流,範圍覆蓋工作、學習、興趣愛好、家庭等;
Part2(3-4分鐘):根據考題準備1 分鐘,並進行 2 分鐘左右的陳述;
Part3(4-5分鐘):基於 Part 2 的話題,和考官進行更深入、更抽象和更具思辨性的討論。
備考方式
題庫複習;
教學反饋(實時打分、優化建議、範文梳理);
考試模擬;
口語素材輔助整理,串題輔導;
訓練進度管理。
產品功能框架
來,掌聲送給這位全能的專家!
(靴靴大家⁄(⁄ ⁄•⁄ω⁄•⁄ ⁄)⁄)
Step 3:功能開發
利用Prompt工程和多Agent機制,我們完成了整個產品的功能設計。整體的功能實現思路如下:
1. 利用COT+Fewshot,讓模型能夠基本準確執行任務鏈路。
以Part1的出題Prompt爲例:
2. 通過Prompt結構性的優化,使得模型具備準確召回,並處理特殊情況的能力。
以題庫的結構化邏輯爲例,我們通過準確定義的Markdown語言邏輯,讓模型實現的複雜的題庫召回:
多 Agent 設計
在多 Agent 的跳轉邏輯設定中,在Part1/2的模型中,我們選擇了“在當前節點的運行過程中識別”的模式,讓Part之間的跳轉決策後置,讓跳轉行爲更爲可控。但是對於希望用戶能夠沉浸完成正常考試的“模擬考試”節點,我們選擇了“獨立於當前節點的模型識別-大語言模型”模式,增加跳轉決策受到Prompt影響的權重,對跳轉行爲做出了更多強制性的限制。下面是我們用於“模擬考試”節點的提示詞:
通過模擬不同類型的用戶行爲,來制定Bot功能的評測集,從而衡量Bot表現是否符合預期。下面是制定評測集的思路:
Session 1: 模擬學霸類用戶對 Part 1/2/3 進行評測
重點評測方向:
回覆的準確性與穩定性;
逐句優化的穩定性;
在引入一定干擾情況下,測試 Bot 的記憶能力至穩定。
Session 2: 模擬口語較差用戶對 Part 1/2/3進行評測
重點評測方向:
回覆的準確性與穩定性;
逐句優化的穩定性;
在存在較多幹擾情況下,測試 Bot 的記憶能力上限。
Session 3: 模擬準備初期用戶梳理 Part 2 材料與串題
重點評測方向:
梳理提問思路是否合理;
材料整理的質量;
串題的準確性。
Step 5:數據回收&優化
根據多輪真實用戶的反饋,我們針對性地對Prompt和功能邏輯做了優化,從而在語氣優化和細節處理方面更有把握。
Bot上線後,已經有大約4500名用戶使用,人均對話輪數超過10輪,人均對話時長超過10分鐘,更懂同學們的Bot,就更厲害哦~
最最最最後!
歡迎大家打開釦子 Bot 進行雅思口語的練習
給我們真實反饋!
我們也將整體配置在我們的 Bot 商店公開了
一起創造更多 AI + 語言的場景!
1、本文是 芥末堆網原創文章,轉載可點擊 芥末堆內容合作 瞭解詳情,未經授權拒絕一切形式轉載,違者必究;2、芥末堆不接受通過公關費、車馬費等任何形式發佈失實文章,只呈現有價值的內容給讀者;3、如果你也從事教育,並希望被芥末堆報道,請您 填寫信息告訴我們。
來源: 芥末堆