☰

從AI輔助音樂創作專利技術思考使用者創作的原創性

※如欲轉載本文，請與北美智權報聯絡

陳秉訓／國立政治大學科技管理與智慧財產研究所教授

以AI輔助創作音樂不是夢，國內有公司推出以AI輔助創作音樂的APP。問題在於著作權法能否保障APP使用者所創作的音樂。本文欲藉由該APP背後的AI技術，即新型專利第M578439號，與使用者操作分析等爲基礎，以討論使用者著作之原創性。

技術背景

新型專利第M578439號所採用的AI技術爲利用卷積神經網路（convolutional neural network，CNN）、或遞歸神經網路（recurrent neural network，RNN）的長短期記憶（long short-term memory，LSTM）模型之演算法程式，爲深度學習技術之延伸。

深度學習技術所採取「人工神經網路」的演算法，其基礎是線性函數：h(x) = b + θ1x1 + ... + θnxn = b + Σθixi (i=1 ~ n)，h爲模型，xi爲變數，θi爲對應於xi的權重，b爲偏差）。基本的神經網路由輸入層、至少一層隱藏層、及輸出層所依序排列而組成，又稱「完全連接前饋式網絡」（fully connected feedforward network）。

如圖1所示，輸入層由線性函數的數個xi，即輸入數值或輸入節點，所構成。一組輸入節點的組合可配對一組權重θi組合Σ，而產生一個輸出節點h，或可稱「神經元」。同一組輸入節點組合可對應數個權重組合，而以矩陣運算產生一組輸出節點組合。如圖2所示，隱藏層的輸入節點組合可以是前一層的輸出節點組合；輸入節點合組的節點數可由前一層的權重組合個數來操控。如圖3所示，各權重與其對應的輸出節點間可插入一個激活函數（activation function，AF），即非線性函數，其功能在限縮輸出值在某一個範圍內。

圖1：基本的神經網路，

圖2：有隱藏層的神經網路

圖3：激活函數的神經網路

專利技術

本件專利所提出的「自動詞曲創作系統」包括曲調分析引擎11、歌詞分析引擎13、風格選擇單元14、歌詞選擇單元15、及曲調選擇單元17，如圖4所示。

曲調分析引擎11和歌詞分析引擎13是AI技術的核心。曲調分析引擎11爲神經網路12程式爲基礎，並根據多媒體資料庫20（音樂網站資料庫）的流行音樂與其排名爲資料而進行分析，進而學習「受歡迎音樂的曲調架構」併產生流行音樂的曲調組合，以建構曲調組合模型111（內含多個曲調集）。歌詞分析引擎13則利用多媒體資料庫20的音樂排名順序及文字資料庫（詩詞資料庫）21的熱門瀏覽率等二項資訊，並同樣以神經網路12程式來分析「受歡迎音樂的歌詞架構」及「來自該文字資料庫21的詞句架構」，以建構歌詞組合模型131（內有多個歌詞集）。

圖4：新型專利第M578439號說明書的圖示

關於歌曲分析，神經網路12程式根據流行音樂的「前奏、主歌、導歌、副歌、過渡、及尾奏」的排列模式，「藉由能量結構變化、頻譜結構變化、音階變化、時間長短變化、音量大小、樂器複雜度、歌詞內容、及頻率重複等」，以「判斷其爲主歌或副歌」；「再分析主副歌、發音分類、屬性、及平仄順序」，或「透過隱藏馬可夫模型（Hidden Markov Model，HMM）」以「機率建構樂理模型並經過調整」，如此以「找出各種不同曲風屬性中受歡迎的曲調集」，進而「建構出該曲調組合模型111」；最後，「可藉由使用者的意見回饋」以「調整或保留各該曲調組合模型111」。

隱藏馬可夫模型是以機率觀點來解析符號序列，其透過「可觀察層的觀測序列」（observation sequence）推得出「隱藏層的狀態序列」（state sequence）。操作時，必須假設隱藏層的「狀態」，以透過可觀測的符號（例如音符或其頻率），來找到隱藏層從「一狀態」轉到「下一狀態」的機率。

關於歌詞分析，神經網路12程式亦利用如同其進行歌曲分析時之方法，來「找出各種不同風格屬性中受歡迎的歌詞集」，並「建構該歌詞組合模型131」，進而由「使用者的意見回饋」以「調整或保留各該歌詞組合模型131」。但專利說明書內未提到如何以隱藏馬可夫模型進行歌詞分析。

從專利說明書對曲調分析引擎的描述中，可粗略理解樂易創AI的音樂創作過程。該AI對流行音樂有一定的分析模式，其將歌曲分爲前奏、主歌、導歌、副歌、過渡、及尾奏等部分。不過，專利說明書未揭露各部分之意義，而是在樂易創的網站上有解釋[1]。另因相關程式的具體內容不明，故僅能假設所產生的旋律或歌詞是一連串的數位資訊。

使用者創作過程之描述

爲分析著作權相關議題，有必要敘述「樂點APP」的使用過程[2]。首先，該APP要求使用者就「整首設定」、「詞」及「曲」等三類事項中進行參數選擇。在「整首設定」部分，有「歌曲模板」和「個人喜好」；前者提供歌曲結構的選項：短曲、「主歌-副歌」、「主歌1-主歌2-副歌」、與「主歌1-副歌1-主歌2-副歌2」；後者目前未有選項。

在「詞」部分，有「主題」和「子主題」；前者提供歌詞主題的選項，而每個主題有各自的子主題；例如「旅行情懷」主題包括「山」、「水」和「海」等三個子主題、「戀愛」主題包含「初戀」、「暗戀（單戀）」、「告白」、「熱戀」與「分手與思念」等五個子主題。在「曲」部分，有「曲風」、「情緒」和「樂器」等三個分別獨立的參數；「曲風」有「抒情」和「快歌」，「情緒」可選擇「快」或「慢」，「樂器」則可挑「鋼琴」、「電子琴」和「吉他」。

在使用者就「整首設定」、「詞」及「曲」等三類事項決定好參數後，該APP即針對「主歌」部分與「副歌」部分分別提供四組歌詞的選項，而每組歌詞乃四段歌詞段落之組合。該些歌詞乃爲該APP伺服器端之內建詞庫所提供的歌詞，且都是CC（creative commons）授權而可自由使用與修改。使用者可依照該APP所給定的歌詞組選擇一組，而得到一對的主歌歌詞和副歌歌詞。另使用者亦可修改該APP所給定的歌詞，或自行創作歌詞；但一段歌詞的「字數」會被該APP限制在一個範圍內，非使用者可決定。

完成歌詞後，該APP繼續給「主歌」部分與「副歌」部分等各四組旋律的選擇。使用者可從四組旋律中選取一組，並接受該旋律。但使用者亦可就選好的旋律進行修改，而可針對該旋律之任一個音符給予「調整音高」與「調整音長」之變動。完成旋律後，該APP接着建議三個編曲。使用者可由該三個編曲中擇一，並採納該編曲。而使用者或可修改所選取的編曲，而調整該編曲的「音階」及「速度」等之升降。

完成編曲後，該APP即協助使用者完成一首流行音樂著作。如果使用者不喜歡AI系統所提供的成果，其仍可使用該APP的編輯工具來調整旋律。最後，使用者可以替該音樂著作命名，並在該APP的資料庫中留下記錄，包括創作者名字、與版權資訊（作詞人、作曲人、及二者之版權比率），而該記錄的資料於「工研院臺灣版權管理區塊鏈」註冊。

原創性分析

使用者著作因涉及人類的精神活動，而有取得原創性之可能。「樂點APP」的操作過程乃就音樂著作的結構（即個別AI著作的編排形式）、系統所回饋的AI著作選項等做選擇，此創作過程類似「編輯著作」，即若「就資料之選擇及編排具有創作性者」可「以獨立之著作保護之」[3]。因此，關於使用者著作，其原創性爭議可從編輯著作的角度來思考。

此外，儘管AI著作本身不具原創性，但不代表使用者著作必然沒有原創性。以電腦程式著作爲例，最高法院於98年度臺上字第868號民事判決指出，自「電腦程式著作列入著作權保護之對象以來，隨電腦科技之日新月異，對於非文字之結構、次序及組織、功能表之指令結構、次級功能表或輔助描述、巨集指令、使用者介面、外觀及感覺，是否均在著作權保護之範圍，審理之法院自應或委由鑑定機關將（主張享有著作權保護之人之受保護）電腦程式予以解構」，以「過濾或抽離出其中應受保護之表達部分」，但「將具有高度抽象性之思想或概念等公共財產及基於效率或電腦軟硬體功能外部因素所限制部分，予以濾除」。

電腦程式著作基本上系由受保護部分（即應受保護之表達部分）和非受保護部分（即具有高度抽象性之思想或概念、基於效率或電腦軟硬體功能外部因素所限制部分等）所構成，但此不影響其原創性之認定。同理，使用者著作即使系由不具原創性的個別AI著作所組成，其整體仍可取得著作權保護。

備註：

(1) http://letronmusic.com/news_detail.php?id=93。

(2) 以1.8.8版爲例。

(3) 最高法院91年度臺上字第940號民事判決/理由。

華邦電子公司製程工程師

聯華電子公司製程整合研發工程師

臺灣茂矽電子公司專利工程師

禹騰國際智權公司專利工程師

威盛電子公司專利工程師

亞太國際專利商標事務所專案副理

美國聖路易華盛頓大學智慧財產暨科技法律法學碩士

政治大學法律科際整合研究所法學碩士

臺灣大學化工所碩士

臺灣大學化工系

從AI輔助音樂創作專利技術思考使用者創作的原創性

相關資訊