■ AIやIoTが当たり前の時代の知的財産のあり方について
本稿は、日本経済新聞に掲載された記事から、AIやIoT時代到来を前提に、いわゆる知的財産権(著作権、特許権など)をどう考えるべきか、つらつらと思いをつづったものです。筆者は基本的に、クリエイティブ・コモンズへの賛同者ではありますが、ビジネスの世界はそういう創作者の意図だけで何とかなるものではないようで、いろいろと問題があるようです。
2016/4/15付 |日本経済新聞|朝刊 人工知能作品に「著作権」 音楽や小説など 政府知財本部方針 法整備を検討
「政府の知的財産戦略本部(本部長・安倍晋三首相)は人工知能(AI)がつくった音楽や小説などの権利を保護する法整備を検討する。現行の著作権法では人による作品にしか著作権は認められないため、盗用されても差し止めや損害賠償を請求することができず、AIへの投資の妨げになる懸念があった。法整備の方針は5月にもまとめる知財推進計画に盛り込む。」
(注)日本経済新聞の記事へ直接リンクを貼ることは同社が禁じています。お手数ですが、一旦上記リンクで同社TOPページに飛んでいただき、上記リード文を検索すればお目当ての記事までたどり着くことができます
最初のお題は、「AIが創作したものに、どう著作権は適用されるのか?」というベタなやつです。
著作権法は音楽や小説、絵画などを作者に無断で使うことを禁止しているのですが、この著作権法は著作物を「思想・感情の創作的な表現」と定義しているので、人手がほとんどかかっていないAIプログラムによって創作された作品について、現時点では同法における権利保護の対象にならないのです。
「知財本部は、AIの機能が進化しつつあることを踏まえた法整備が必要と判断。同本部内の委員会が今月18日に報告書を公表するのを受け、知財計画に方針を盛り込む。」
では、知的財産戦略本部がまとめた「知的財産推進計画2016」の内容を見てみます。
① 現在の知財制度上、AIが自律的に生成した生成物は、それがコンテンツであれ技術情報であれ、権利対象とはならない
② 人間の創作物とAI創作物を外見上見分けることは通常困難である
③ 現著作権制度が無方式主義を採用しているため、創作と同時に知財保護が適用される
④ そのため、尋常ならざるスピードでAIが創作したもので人間の創作物と同様に取り扱われているものが爆発的に増える可能性が懸念される
ゆえに、爆発的に増殖すると思われるAI創作物を自動的に権利保護することは、過剰保護になり、活用者の利便性を損なう可能性があると同時に、市場に提供されたAI創作物がブランド価値を有したり、発明や特許して出願されたりすることも考えられるため、AI創作物の登録およびデータ流通を促進する制度を確立すべき、という提言となっています。
具体的には、同記事では次のように踏み込んで記述されています。
① 著作権に代えて、商標のようにAI創作物の権利を保護する新たな登録制度を設ける
② 不正競争防止法改正などで無断利用を禁じる
③ 権利を得るのはAIを活用して作品を生み出す仕組みを作り出した人や企業とする
④ 無断利用の差し止めや損害賠償の請求権を認め、投資費用を回収できるようにする
⑤ AIを活用したコンテンツ制作を円滑にするための法整備を検討する
⑤については、
「既存の多数の作品の特徴を抽出してAIが創作に生かす場合、基となる作品の権利者に許可を取らなくても済むような著作権法改正を検討する。データの収集・解析は既存作品の複製を伴うが、その都度利用許可を取っていては膨大な情報の処理が難しいためだ。」
とあり、これは次章でその詳細に触れていきます。
(下記図は「次世代知財システム検討委員会報告書~デジタル・ネットワーク化に対応する次世代知財システム構築に向けて~」より引用)
■ AIがディープラーニングで使用したり生み出したりする情報の権利保護は?
AIがディープラーニング(深層学習)を行うに当たり、膨大な量のデータを読み込ませないといけませんが、その中には知的財産権の保護対象のものが数多く含まれていることが予想されますし、ディープラーニングの結果として何らかの知的財産権として保護されるべき情報が生み出されているかもしれません。
2016/6/22付 |日本経済新聞|電子版 深層学習の知的財産権 保護か成長か、未来へ難問 清水亮 UEI最高経営責任者(CEO)
「アルファ碁の活躍で注目を集めている人工知能(AI)の新技術「ディープラーニング(深層学習)」。トヨタ自動車も米国で深層学習などのAI技術を研究する新会社を設立するなど、今後の産業を大きく変える革命的な存在として世界中で期待が高まっている。そこで、今のうちに考えておきたいのは深層学習に関する知的財産権の問題だ。深層学習は、人間の脳の神経回路をまねたニューラルネットワークを使い大量のデータから自分で特徴を見つけて自動的に学習しながら進化していく、まったく新しいタイプの技術だ。そのため、これまでの常識はまったく通用しない。」
(下記は、同記事添付のAI関連の新会社設立を発表し握手するトヨタ自動車の豊田章男社長(右)とギル・プラット氏(左)の写真を引用。引用文から:ギル・プラット氏は米国防総省の国防高等研究計画局(DARPA)に所属していたAI研究の第一人者で、今年1月に米国で設立した新会社トヨタ・リサーチ・インスティテュート(TRI)の最高経営責任者(CEO)に就任した)
清水氏によるディープラーニングAIと従来型AIの違いは下記の通り。
① 従来型のAIは、とある特定データ群から特徴量を抽出する方法はプログラマーの勘や仮説に基づいて決定していた
② プログラマーの手腕次第で有用なデータが得られるかどうかが左右されるため、従来型のAIでは特徴量を抽出する手法自体がプログラマーの創作意図や創意工夫と見なされ、その成果物であるプログラムが知的財産として保護されている
③ しかし、ディープラーニング(深層学習)の場合、特徴量の抽出方法そのものをAI身が学習しながら獲得する
④ つまり、AIが学習に使うデータセットに同じものを使い、同じ構造のニューラルネットワークに学習させれば、誰がやってもほぼ同じ似たり寄ったりのモデルが出来上がる
⑤ ゆえに、ディープラーニングでAIを完成させるにあたっては、プログラマーの力量や勘、仮説といった条件にはほとんど左右されずに、極論するとそもそも特徴量の設計さえいらず再プログラミングをしなくても、誰でも深層学習AIを訓練して活用できてしまう
この場合、ディープラーニング(深層学習)のニューラルネットワークを一度構築することができれば、今後はそれを複製して産業の様々な場所に使うことができるようになります。このとき、このAIモデルの知的財産はいったい誰のものになるのでしょうか?
清水氏によると、この場合の権利者としては次の三候補が考えられます。
① このモデルを実際に訓練した人
② このモデルを訓練するための学習データセットを作った人
③ このモデルが訓練するための学習用生データを作った人
■ AIにディープラーニングさせる場合の知的財産権における留意点とは?
前章の「③ このモデルが訓練するための学習用生データを作った人」の権利保護を優先するとした場合、深層学習のAIモデルを実用的にまで成長させるには、膨大なデータをAIに読み込ませる必要があり、そのすべてのデータの著作権等の権利関係を全てクリアすることは事実上困難です。ネット上に存在する写真や文章を手当たり次第にAIに読み込ませる必要があるからです。
清水氏によれば、
「深層学習の発展のためには、生データの著作権や肖像権は学習用のモデルに変換される過程で消滅するのが望ましい」
ということですが、その際の問題点も明らかにされています。
① 一度学習用モデルに変換したデータからでも、逆行させれば完全にではないが元データをある程度復元できてしまう(→著作者の頒布権を犯す可能性あり)
② 学習に使用したネット公開画像が「好ましくない画像」である場合、ある程度は復元できてしまうので、配布によって「わいせつ図画の頒布」に問われてしまう可能性がある
生データの知的財産権以外にも、ディープラーニング型AIが備える機能から、いろいろな問題がAIモデルの頒布で発生する可能性があることが分かりました。
ちなみに、清水氏によると、
「深層学習のパイオニアであるカリフォルニア大学バークレー校の研究センターでは、著作権に関してはグレーな生データを基に学習させた学習済みのモデルを配布するにあたって、昨年から無制限に使えるようなライセンス条件にした。以前は非商用での利用しか認めていなかったが、方針を大きく変えてきたのだ。生データの著作権処理が極めて難しいため、フェアユースという立場に基づいて、業界全体の発展のためにあえて世界に先んじてライセンスフリーのモデル配布に踏み切ったと考えられる。」
ということで、ディープラーニング型AIの研究進展のために、あえてAIモデル自体の知的財産権をフリーとすることで、現行法をクリアしたということになります。こうした工夫の積み重ねの結果、欧米と日本のAI研究に水を空けられないようにして頂きたいものです。
■ ディープラーニング型AIモデルの知的財産は誰に帰属させたらいいのだ?
今度は、「① このモデルを実際に訓練した人」に知的財産の所有権があるとしたらどんな問題があるかを考えます。
清水氏によりますと、
「前述したように、深層学習では学習データセットと生データさえあれば誰でもモデルを訓練できる。最初の「開始」ボタンを押すだけの行為を、はたして知的財産の創作作業と呼べるかという課題に対する答えも今のところない。たとえば、すでに半自動やほぼ全自動で作曲する手法が存在するが、この行為を創作と呼べるかどうかは人の主観に委ねられるところだ。」
(下記は同記事添付のアンドリュー・ング氏によるAIを使って解析した他人の顔の情報をカメラに写った自分の顔の上に重ねて遊ぶ百度の新サービスを披露した様子を写した写真を引用)
ただ「開始」ボタンを押すだけというのは、実際のAI研究の現場にそぐわない表現だと思います。実際には、どんなデータを用意して、どういう手順でAIに読み込ませて、検証結果の評価方法をどうするか、という一連の作業手続きをリードする人、と考えれば、「ただボタンを押す」というより複雑なことをやっているのですが。しかし、もう少し手の込んだことをやっている、ということと、そういう人に知的財産権の保護を与える、ということとは別問題なのかもしれませんが。
では最後に、「② このモデルを訓練するための学習データセットを作った人」に権利保護が与えられると考えたらどうでしょう? この場合、学習データセットを作るだけでなく、学習に伴うパラメーターの設定などをした人も含めます。
清水氏によりますと、
「学習データセットは生データの権利を侵害しない、いわばリンク集のようなものだ。例えば、深層学習の画像認識分野ですでに広く用いられている「ImageNet」もリンク集として提供されている。このリンク集をフィルタリングして適切な画像のみを抽出し、学習の順番を整えた上で事前処理の加工を施して、それから深層学習AIを訓練するというのが一般的な流れだ。そう考えると、事前処理までの流れはかなり創作に近い行為といえるだろう。」
とあり、ただ開始ボタンを押すだけの人より、「創作活動」に近い作業をしているとも考えられます。但し、現時点ではコツが必要な事前処理の作業も、いずれはかなりの部分まで自動化されそうなので、上記でも触れましたが、何か複雑な作業をしているからと言って、創作活動をしており、知的財産権として保護されるべき、と決めつけるのは早計のようです。
清水氏によりますと、この「② このモデルを訓練するための学習データセットを作った人」の権利保護にも課題があるそうです。
「また、派生モデルの問題もある。一度訓練した深層学習AIについて、別の学習用データセットを与えて再訓練すると、ゼロから学習するよりも早く効果的なモデルが得られる。これを転移学習と呼び、深層学習ではファインチューニングが用いられる。
では転移学習によって学習された新しい深層学習AIの権利は誰が保持するのだろうか。再学習した人間か、それとも、転移学習される前の深層学習AIの二次著作物となるのか。このあたりはまだまだ議論の尽きないポイントだ。」
デジタル創作物である以上、容易に複製が作れ、微調整も比較的機動的かつ簡便に行うことができます。それゆえ、「転移学習」で生み出されたAIモデルは、そのものが知的財産権の保護対象なのか、オリジナルAIモデルの二次著作物として保護されるべきものなのか、議論が分かれるところです。
プログラムは著作物か?
昭和60年の法律改正でプログラムも著作物として新たに保護されることになりました。
例)
・パッケージソフトのプログラム
・家電の制御プログラム
・ソースプログラム
・オブジェクトプログラム
・アプリケ-ションプログラム
・オペレーションシステム
・コンパイラ 等
但しこれらの著作権保護には条件が付いており、
「創作性がないプログラムは保護されない」
つまり、誰がつくっても同じ表現のプログラムになるのであれば、創作性がないと判定されるのです。現行法の枠組みのままでは、
① ディープラーニングAIに読み込ませるデータに著作物が含まれている場合、その権利保護の問題の解決は、日本のAIテクノロジーの進展に大きく影響する
② 現行のプログラムに対する著作権の考え方では、「創作性」が大事で、ディープラーニングAIモデル自体が「創作性」を有しているかどうかは微妙→新法・法改正で対応すべき
というあたりでしょうか。
同記事は、
「経済産業省と産業技術総合研究所は、この問題提起に対し有識者を集めた「機械学習利用促進勉強会(MLEP)」を発足させた。こうした動きは今後も活発になっていくだろう。深層学習AIが産業の原動力になったときに正しく国益を守るためにはこうした視点も欠かせないものとなるだろう。」
という文言で締められており、そのまま当局の積極的かつ迅速な法改正を望むものであります。
(参考)
⇒「 AI、IoT時代の知的財産権(後編)ー 深層学習やIoTで得た情報を営業秘密で守る道があった! 日本経済新聞より」
(注)職業倫理の問題から、公開情報に基づいた記述に徹します。また、それに対する意見表明はあくまで個人的なものであり、筆者が属するいかなる組織・団体の見解とも無関係です。
コメント