LINE DEVELOPER DAY 2019 盛大展開

LINE 於今(2019)年11月20日至11月21日於日本東京舉辦年度科技盛會-LINE DEVELOPER DAY 2019,吸引各國將近3,000名開發好手齊聚。今年 LINE 首度將 LINE DEVELOPER DAY 2019 擴大爲連續兩天的活動,LINE 技術樸懿彬於開場演說從人工智慧、數據平臺基礎設施資安與隱私三大關鍵技術領域來說明 LINE 如何爲用戶匯聚更便利有趣的數位生活應用 - LIFE with LINE;其中,人工智慧尤其是今年的重頭戲,有多項創新應用於開場時段現場展示;同時,樸懿彬也鼓勵外部開發者利用 LINE MINI App 平臺發表創新應用,將應用連結到 LINE 平臺,豐富 LINE 的生態圈

今年的 LINE DEVELOPER DAY 是第五屆,也創下有史以來最多臺灣開發工程師參與的紀錄,將近30位來自臺灣的開發工程師在現場分享有關人工智慧、非技術性主題,如 UI/UX 及專案管理資料及 API 應用等內容,並透過實作工作坊大方分享專業領域知識;近兩年,LINE 在臺灣投入越來越多的開發資源在人工智慧、資料科學與資料工程上,且透過機器學習不斷精進中文的自然語言處理,目前已應用在「LINE 客服小幫手」中的客服機器人,用以更精確的理解和回覆用戶的問題、在「LINE訊息查證」中,用以判斷用戶回報的錯假訊息是否查覈過,以及比對查覈結果,也應用於 LINE MUSIC 的歌曲搜尋、LINE 購物的相關商品推薦;另外,臺灣的團隊也與總部協作將技術應用在 LINE TODAY 的新聞推薦、Smart Channel個人化推播的內容推薦,以及跨服務的搜尋功能等。

LINE 的生態圈中除了有 LINE 開發的多元服務以外,也串接越來越多的外部應用。爲促進外部開發社羣蓬勃發展,今年大會也發表爲外部開發者持續優化的各種 API 工具,包括新版的 LIFF v2、Messaging API、flex message simulator(beta)、以及新推出的 friends statistics API 等,並鼓勵外部開發者透過 LINE MINI App 發表平臺將應用直接連結到 LINE 平臺,讓用戶在 LINE 的主頁聊天室下方的+選單等環節,就可以搜尋或使用這些服務。

同時,LINE 生態系中的服務已累積巨量的用戶授權的可用資料,且透過機器學習不斷精進以達到更人性化的使用體驗,更精確的推論用戶偏好。但數據平臺上的資料龐大且複雜,爲了讓大數據發揮效益,產生更大的價值,LINE 一方面利用人工智慧技術進行資料分析,一方面依循兩大原則來設計所有系統流程:一切以保護用戶隱私爲優先考量,以及避免資料孤島。LINE 建置統一管理的自助式數據平臺(Unified Self-Service Data Platform)與基礎設施,克服跨服務,整合異質性與非結構化資料的挑戰,讓資料分析師與資料科學家可以取得完整的學習數據,同時做好嚴謹的資料管理,以確保資料運用的有效性與適切性。

以下是 LINE 於三大關鍵技術領域的進展

1. 人工智慧 – 實現人性化的使用體驗LINE 於今年大會中展示諸多人工智慧技術的實際應用,包括首度採用臉部辨識加快千人入場報到的程序。與會者在活動前將自己的臉部照片上傳至 LINE DEVELOPER DAY 官方帳號中,入場時在櫃檯僅需不到一秒鐘就能透過臉部辨識完成報到,快速消化人潮。將人工智慧發揮得最引人入勝的應用,是開幕時段現場展示的個人化字體產生技術,書寫機器經學習後,可以產生一套完整的與個人字跡相仿的日文字體,取代學生手寫報告的辛苦。

另一注目焦點則是 LINE BRAIN 計劃。LINE BRAIN 整合了 LINE 旗下所發展的各項人工智慧技術,包括 Clova雲端虛擬助理,向外推廣尋找合作伙伴。在地化的發展策略讓 LINE 的人工智慧技術在亞洲掌握了優勢,透過日語等亞洲語言數據庫的訓練,輔以在地用戶的行爲數據做分析,讓 LINE BRAIN OCR 光學字元辨識技術與 LINE BRAIN VISION 人臉及影像辨識技術的準確性較歐美技術高。

今年6月於 LINE東京年會中所展示的以人工智慧協助餐廳處理顧客電話訂位語音應答技術,也有具體的進展;採用此技術的 LINE AiCall 服務已正式上線,結合了 LINE BRAIN 的語音識別、聊天機器人和語音合成做自然語言處理,實現自然對話,目前已與日本 My Grill&Bakery Otemachi 等幾家特定餐廳開啓實際的合作。

2. 統一管理的自助式數據平臺與基礎設施在 LINE 數據平臺上,每日產生超過1兆筆的新記錄、壓縮過的新數據超過390 TB、執行7萬個不同的資料處理程序、在 Presto 上有3萬個資料查詢程序,每日的資料處理與計算的規模驚人。因此,LINE 採用統一管理的一套可讓內部資料分析師和資料科學團隊自助使用的數據平臺,有效且嚴謹的運用與分析跨服務所累積的資料;並在雲端系統建構和運行基礎設施,以支撐全球用戶每日傳送高達50億則訊息,以及超過1 Tbps 的網絡流量。由於資料位於各服務的數據平臺,更需要資訊安全管理,例如確保資料的可搜索性、數據目錄的創建、通訊機密等,因此 LINE 以開源技術自建私有云 Verda,將各服務的數據平臺整合成一個大平臺,有效提升和完成各方面的升級。爲處理龐大的網路流量,LINE 建置超過4萬臺伺服器,若堆疊起來,高度約2,200公尺,超過3.5座日本最高的建築物東京晴空塔 TOKYO SKYTREE(634公尺)。

3.資安傻隱私 – 一切以保護用戶隱私爲優先考量LINE 致力保護用戶資料和隱私,在合法運用資料的同時,也嚴格遵守法律和隱私注意事項。爲了更嚴謹的使用數據來優化服務,資料治理是不可或缺的要素。LINE 在所有服務開發初期的功能設計階段即導入隱私設計(Privacy by Design),隱私和法律團隊會進行最嚴格的審查並提供建議。

LINE 從多個層面同步維護資安與用戶隱私,其中包括自2016年推出的 LINE 資安漏洞回報獎金計劃,從今(2019)年11月15日起,正式轉移到 HackerOne 平臺上,向全球頂尖的駭客開放,並定期公開弱點修復報告,持續強化資安防護;自2016年開始每半年定期公佈的 LINE 透明度報告,也清楚公開全球執法單位調閱要求之數據;此外,LINE 於每年春秋兩季各舉辦一場圍繞資安與用戶隱私權議題的高峰論壇,邀請世界各地的專家學者針對數位身份、生物識別、隱私、用戶評分機制、人權問題等主題進行廣泛且深入的討論,期爲用戶提供更安全、可信任的使用環境。同時,LINE 導入機器學習技術打擊令人頭痛的濫用與垃圾訊息。最初,由於無法即時修正機器學習模型,因而散播垃圾訊息的攻擊者隔一段時間就會找到規避的方法,對此 LINE 採用「概念偏移分析」及「無尺度網路」的演算法概念,從攻擊者行爲的變化中自動學習並修正模型,提高檢測準確性且有效抑制垃圾訊息問題。