2018/08/08-09 LET全国大会(大阪)報告 / コーパスと著作権
|
会場となった千里ライフサイエンスセンター
高層ビルの5階と6階で開催された
大ホールで行われた Judy Noguchi さんのスピーチ
「 外国語教育における4技能評価の再考 」 をテーマに開催された外国語教育メディア学会(LET)全国大会で、ミント音声教育研究所の田淵龍二は、コーパスと著作権についての研究発表をおこなった。
2009年の法改正で 検索エンジンは許諾不要と明記されたことを 文科省の資料を使って説明する田淵
|
もくじ |
- 背景
- 言語処理学会とコーパス検索
- 検索サービスと著作権
- 教育と著作権
- コーパス検索と著作権
- アンケート
- 質疑
|
|
|
研究のきっかけは、昨年秋に予定されていた田淵龍二の研究発表が大会運営者によって一方的に中止とされたことだった。大会運営者は外国語教育メディア学会関東支部で、中止を一方的に決めたのは支部執行部(正副支部長)である。研究成果の一つであるTEDコーパスが
との理由であった。
問題とされたTEDコーパスを公開したのはこの年の夏(2017年8月)のことで、さっそくLETで研修会を行ったのが秋(2017年10月14日)のことだった。
「著作権侵害で訴えられる恐れがある」とされたのは、研究発表で取り上げるTEDコーパスであった。このコーパスは、当の関東研究支部支援プログラム(2年間)の成果のひとつでもある。今回の発表ではそのコーパスを対象とした検索エンジンを取り上げていた。表題は
- 2016年度関東支部研究支援プログラム成果報告
- --- リーダビリティ、語彙レベル、発話速度を手掛かりとして、日本の英語学習者レベルにあったTED Talksを選び出すウェブコーパス開発
発表者は田淵龍二(ミント音声教育研究所)と研究支援プログラム代表山口高領(立教女学院短期大学)であった。
発表中止を決定したとしつつも、何を根拠に「著作権侵害」があると決め付けたのか、何を持って「訴えられる恐れ」があると判断したのかについて、説明もなければ、当事者への聴き取りも一切ないままの処分であった。当の支部長湯舟英一氏から
- 訴えられる恐れがあると意見した委員を除くと、他に詳しい委員はいないから、直接説明して欲しい
旨の連絡を受けていたのにである。
- 参考記事
- 外国語教育メディア学会(LET)への申し入れ
その後執行部は問答無用の態度をとり続けたことから、田淵龍二は他の学会(言語処理学会やJASET)でTEDコーパスの研究発表を行うと同時に、教育における著作権についての研究を始めたのだった。
- 参考記事
- JACET での研究発表
- 言語処理学会での研究発表
半年の研究と活動の中で分かってきたことは次の3つである。
- 言語処理学会は盛んにコーパス研究を行っている
- それまでグレーだったコーパス検索は、2009年に日本でも適法と明示された
- 21世紀の到来とともに始まったGoogleやYahooの検索サービスは、日本では「著作権法違反」との認識が一般的であったが、日本政府は2009年になってようやく法整備にこぎつけた。この間の事情を示す文書が公開されている。詳しくは次々節 ⇒検索サービスと著作権
・・・このような動きの中で
- 教育機関における著作権への理解不足と萎縮が目立ちはじめ、文科省から問題視されている
TED はクリエイティブ・コモンズを採用していて、 ビデオの自由で公正な利用を呼びかけていることを、 ⇒サイトの記事 を示して説明する田淵
|
|
言語処理学会(Natural Language Processing; NLP)の全国大会では毎回300本ほどの発表要項論文(1本6ページ)がデジタル公開されている。去年(2017年)の大会までの10数年分(約4千本)を調べたところ、その半数の約2千本でコーパスへの言及があり、構築したコーパスの公開をめぐっては著作権処理に苦労していることが見受けられた。著作権処理に触れている40本ほどの論文を調査したところ、著作権処理の方法にはいくつかのパターンがあることが分かってきた。
キーワード「コーパス」で検索した様子 棒グラフは年毎の論文ヒット率を示す。
主な処理パターンは7つに分類された。さらにどのような処理をするのかを決定する要因には7つのポイントがあることも見出された。これが、今回の研究発表の骨格となっている。
コーパス構築後の公開と著作権処理 |
1. 著作権処理を実施して公開 |
2. 保護期間終了の著作物のみ公開 |
3. 公開を断念 |
4. 解析結果(例:n-gram)のみ公開 |
5. 元著作物へのリンクを公開 |
6. (疑似)テキストを生成して公開 |
7. クリエイティブ・コモンズで公開 |
著作権の扱いを左右した主な要因 |
A. 著作物が自前か否か |
B. 著作権保護期間内か否か |
C. 著作権者が少数か膨大か |
D. 著作物がウェブ公開か否か |
E. 公開が目的か否か |
F. 必要なのは著作物本体か解析結果か |
G. 製作者の予算と人員の大小 |
ちなみに、4千本もの論文をコーパスと著作権で解析処理するために田淵は「論文コーパス検索エンジン・ナックス ⇒NaCSE」を自作した。このNaCSEについては、言語処理学会(NLP)の協力を頂戴することができた。また成果の一端は、この6月の外国語教育メディア学会(LET)関東支部大会で研究発表している。⇒参照記事
|
|
検索サービスと著作権については2つ前の節で簡単に触れたとおりだが、コーパス検索が日本で正式に法整備されたのは2010年であった。その間の事情を文化庁は次のようにまとめている。
- インターネットでの情報検索サービス(Yahoo!やGoogle)に伴う、
- 情報の収集、整理・解析、検索結果の表示が、
- 著作権法に抵触する可能性があり、
- 日本国内にサーバーを設置できないとの指摘がされてきた。
-
- 情報検索サービスに必要な行為は、
- 著作権者の許諾を得なくても可能とすることを
- 今回の法改正で明確化したことで
- 国内でも安心して情報検索サービスが実施できるようになり、
- 次世代サービス開発が加速する。
- −−−−− 以上 筆者要約
上記の法改正の内容は、さらに変化し、検索サービスの著作権処理は大きく変わりつつある。以下にそれについて述べる。
今年(2018年)5月の著作権法改正(施行2019年1月)に伴って発表された文書には、次のように記されている。
上の図は、来年施行される著作権法改正の目玉である「所在検索サービス」の範囲拡大を説明したものである。検索対象をこれまではネット上にある著作物に限っていたが、まだネット上にない書籍や映像も、ネットから検索可能にすることが可能になることを示している。
|
|
教育、特に語学教育にとっては、教材が欠かせない。語学教材は著作物であるから、著作権との関係をしっかり抑えておく必要がある。しかし皮肉なことに、国から見た教育現場の評価は低く、問題視されていることが分かった。
- 文化庁曰く
- 「 文化庁の実施した調査研究や、文化審議会における関係団体からのヒアリングにおいて、ICT活用教育における著作物利用をめぐって以下の課題について指摘 」 があったとし、 「 教育機関の著作権法に関する理解が不十分 」 という現状があり、著作物 「 利用の萎縮 」 が見られ 「 権利処理の要否が判断できなければ利用を差し控える 」 などによる 「 教育の質の低下 」 が問題にされている。
上図の引用文中にある「教育機関と権利者団体との間で合意した法解釈に関するガイドラインがない」点について、ここで注目しておきたい。
実は、日本にはすでに「ガイドライン」が存在している。⇒「学校その他の教育機関における著作物の複製に関する著作権法第35条ガイドライン」 である。2004年1月に施行された著作権法改正に伴い、関係団体が協議の上公表(2004年3月)したものである。文書の冒頭に次のような経緯が記されている。
- 文化審議会が音頭をとって
- 権利者、利用者双方が
- 2002年1月から9月まで協議した。
- その後も双方で検討を重ねたが、
- なお協議を要する箇所が残ったため
- (ガイドラインが2004年1月施行に間に合わなかったことから)
- 権利者側として単独で
- 新年度授業が開始する前に
- ガイドラインを公表した。
- (丸括弧内は筆者による補充)
権利者側のガイドラインは公表されたが、利用者である教育機関側のガイドラインは存在しない。どうやら教育機関側の意見がまとまらなかったと思われる。
教育機関側のガイドライン不在は、教育現場の教員にとっては混乱要因となり「教育現場の萎縮」につながったのではないだろうか。
先の文書での「理解が不十分」や「萎縮」の文言は、こうした教育機関側の状況が10年以上経っても一向に改善されないことを指していると考えられる。
来年(2019年1月)から施行され始める「柔軟な権利制限規定」では、従来以上に現場の判断が重要となることから、権利者利用者双方合意によるしっかりとしたガイドラインが必要となる。そうした行政判断から、利用者(教育機関側)に投げかけられた言葉として、重く受け止めなければならない。
教育現場における「理解が不十分」や「萎縮」について、現場の先生方はどう見ているのだろうか?
今回の研究発表でアンケートしたところ、「理解が不十分」や「萎縮」があると思う先生は80%であった。詳しくは後の節 ⇒アンケート
田淵は2016年秋から独自に、eラーニングに関するガイドライン作成を手がけ、出版社数社と合意するに至った。詳しくは ⇒記事(2017/01/06 > ウェブ授業で出版社と合意) にある。その後、2017年秋の研究発表中止事件が持ち上がったこともあり、今回の研究発表につながったのであった。
|
|
研究発表
題目: コーパス検索と著作権
日時: 2018年8月9日(木)10:00-10:30
発表者: 田淵龍二
所属: ミント音声教育研究所
表題: コーパス検索と著作権
要項: ⇒pdf
ハンドアウト: ⇒pdf
参加者: 20〜30人程度
- コーパスを使った研究や学習の機会が増大しているが、円滑にアクセスするための検索システムが必須で、Google などの検索サイトが有名である。
- また、検索エンジンの開発は、科研費研究の対象分野でもある。
-
- 他方、コーパスは著作物なので著作権の問題が生起するが、法律が IT に対応しきれておらず、これに教育機関の理解不十分さが拍車をかけ、混乱や萎縮(文化庁, 2017)があるとされる。
-
- そこで、コーパス構築とコーパス検索エンジン開発における著作権の処理実態をあきらかにすることを研究目的とした。
-
- 方法としては、コーパス構築の専門家が集まる言語処理学会の論文 4,428 本から、文中に「コーパス」と「著作権」を含む論文を、論文検索サイト ⇒NaCSE で検索し、精査した。
-
- その結果、構築したコーパスにおける著作権の扱いは 7 つに分類され、著作権処理の扱いを決めた要因を調べたところ 7 つの因子が明らかとなった。
発表では、この5月(2018年)に国会で採択されたばかりの改正著作権法に触れながら、その趣旨と背景を具体的に解説を加え、「 著作権侵害で訴えられる恐れがあるから教育研究活動をしない 」 と言う外国語教育メディア学会(LET)の態度が時代にそぐわないことを明らかにしていった。
|
|
発表会場は、小学校の普通教室よりも小さめな部屋で、20人ほどのゼミ室仕様だが、テーブルをなくして空間を確保し、椅子だけを40席ほど配置していた。資料を閲覧しながら聴講するには不便な環境であった。通常の狭い会議室仕様なのでスピーカー設備もなく、パソコンからの音声をスピーカーに出力することもできない。
書記台がない状態だったが、それでも7人の方にアンケートに応えていただけた。
アンケート用紙と集計結果: ⇒pdf
詳細な数字は ⇒pdf に譲り、ここには、全体を俯瞰したまとめを記しておく。
- [1] 今年の改正で新たに導入された 「柔軟な権利制限規定」 についての理解度が6割と低かったが、全体としては8割ほどの理解度を得ることができた。
- フェアユースやクリエイティブ・コモンズを見聞きしていた有知識者は4人程度(1割強)だったことを考えれば、まずは、成功したと思う。
- 「柔軟な権利制限規定」 については新概念なので、説明の工夫が必要であろう。
-
- [3] 教育をめぐる著作権の動向については、3割の理解度にとどまった。
- 今世紀に入って、めまぐるしく改正が続くこともあり、全体像をつかむことに困難が伴うことがわかった。
- 特に、古い時代に著作権を扱った経験や学習だけを頼りに、今だに因習に囚われて、新しい動きを拒もうとする傾向もうかがえるようだ。
-
- [4] 学校現場での著作権への理解不足と萎縮について、同意しない方は1人もいなかった。
- 指導的立場にある行政や学術団体の対処が求められている。
-
- [5] 今後のeラーニングにおける著作権処理について楽観できないとする意見が過半数を超えていた。
- これから大学に入ってくる学生は、子供の頃からスマホに親しみ、AIに触れてきた若者であることを考えると、eラーニングにおける著作権処理を、保護と活用の両面からしっかり行うことの必要性を実感した。
- もっと知りたい。発表の時間が足りない。
- 責任の所在をはっきりさせないという日本的な事情があると思う。
- TED はとてもよい教材です。
- メディアを使う限り著作権は避けることはできませんのでたいへん参考になりました。
- がんばってください。Talkies は便利です。
- 貴重な情報をありがとうございました。頑張ってください!
- 臭いものにフタをするのではなく、若者たちに胸を張ってeラーニング教材を提供できる環境作りが必要だろう。
- まずは、学術団体において率先して議論を始めたい。今回の発表がそのきっかけとなれば幸いである。
|
|
- Q:
- A:
- (昨年11月ごろからメールのやり取りをしていたところ)7月に、サイトを閉じてくれとのメールがTEDから来ました。どこを削除すればよいのか具体的に指摘するように求めた返信をしたところ、相手は応えられなくて、一般的な話が返ってきたました。そこで、さらに詰めているところです。
-
- --- コメント
- 詳しくはこの節下段の参考資料(リンク)を参照
-
- 最後の通信は田淵からの8月1日付け送信。
- 送信時に添付した文書 ⇒ひらく
- 8月11日現在でTEDからの返信はない。
-
- Q:
- A:
- リクエスト・チーム(The Media Request Team)です。TED Talks を教材として出版している会社がありますが、そう言う要望を受け付けるところのようです。
- クリエイティブ・コモンズ(CCL)を宣言している著作者(団体)に許諾を求めるということは普通あり得ないことで、そうした問い合わせを個別にして欲しくないからCCLを採用しているわけで、そこらのずれがあるのだろうと思っています。
-
- --- コメント
- TEDサイトには ⇒TED Media Request Form がある。商用で使いたいビデオを指定して送信する仕組みである。
-
- そこには、商用でなければ(いちいち問い合わせしないで) ⇒利用規約とCCL に従って使うように書かれている。
- ⇒拡大
参考資料
⇒2018/08/03 > コーパスをめぐる TED との経過報告
|
..[↑] 8 |
2018.08.11 田淵龍二
|