ミント音声教育研究所
ホーム

ミント アプリ
ケーションズ

ホーム

映画映像シーン検索サイト
セリーフ

字幕付き動画再生サイト
トーキーズ

Googleでサイト内を検索
    
ミント名作劇場
日本の昔話
朗読絵本

「竹取物語」

群馬の昔話
朗読絵本

「猿地蔵」」

日本の名作
朗読
芥川龍之介

「トロッコ」

英語朗読絵本
マザーグース Mother Goose

映画
オズの魔法使い

歌「オーバーザレインボー」

映画
カサブランカ

シーン「君の瞳に乾杯」

英語で折り紙 Origami
折鶴 つる crane

ベクターライブラリ
公開作品一覧
英語作品
朗読絵本
ふしぎの国のアリス

第1巻

聞き取りドリル
オバマ大統領 就任演説

聞き取りドリル
オバマ ノーベル平和賞演説

語学ソフト
ミングル
リーダビリティ計測ソフト

ワーズピッカー
英単語拾い2

ゲーム
朗詠・百人一首
読み上げ&ゲーム

数独ナンプレゲーム
東海道五十三次
詰独 一人旅

数独ナンプレゲーム
富嶽36景 富士登山
詰独 次の一手

ユーティリティ
書き起こしソフト
ゆ〜ゆ バリュー

書き起こしソフト
ゆ〜ゆ ライト

書き起こしソフト
ゆ〜ゆ ビジネス

書き起こしソフト
ゆ〜ゆ アカデミー


2018/06/16 外国語教育メディア学会で研究発表


梅雨空の下、外国語教育メディア学会(LET)関東支部大会が開催され、100名を越える先生方が参加した。

┏━━━━━━━━━━━━━━━━━
 名称: 外国語教育メディア学会関東支部 第140回研究大会
 主催: 外国語教育メディア学会関東支部
 日時: 2018年6月16日(土)10時〜
 会場: 筑波大学 東京キャンパス 文京校舎
    東京都文京区大塚3-29-1
 交通: 東京メトロ丸ノ内線 茗荷谷駅下車 徒歩5分
━━━━━━━━━━━━━━━━━━━┛

大会会場 筑波大学(東京都文京区)

小泉利恵(順天堂大学)基調講演会場風景





もくじ
  1. 学術論文検索エンジンの要件
  2. 質疑応答

..[↓] 1
 1 学術論文検索エンジンの要件もどる
もくじへ

ミント音声教育研究所の田淵は、この春に開発し公開中の学術論文検索エンジン「NaCSE ナックス: Natural Language Corpus Search Engine」について、その設計思想をテーマに研究発表を行った。

┏━━━━━━━━━━━━━━━━━
題目: 学術論文検索エンジンの要件のひとつ
― 文脈検索結果
━━━━━━━━━━━━━━━━━━━┛

発表要項は ⇒こちら
NaCSE の説明は ⇒こちら

学術論文検索エンジン NaCSE の研究発表風景(田淵)

検索エンジン NaCSE 開発の動機は、コーパス構築における著作権処理の実態調査にあった。

調査対象を言語処理学会(NLP: Natural Language Processing)に絞り込んだ理由の第一は、日本でもっとも熱心にコーパス開発に取り組む学会のひとつであるからだ。言語処理学会は毎年300本程度の論文を公開していて、1995年以来の20数年間で5千本に及ぼうとしている。生きた技術教科書であり、先人の体験記でもある。

しかし、5千本近いNLPの学術論文から所望の論文を見つけ出すのは容易ではなかった。調べていくうちにすべての論文が年度ごとに整理されてウェブで公開されていることが判明した。NLP は自らの学術研究の足跡を整理してアクセス可能な状態で蓄積する作風と方法を持っていたのだ。

そこでさっそく専用の検索ツールを構築することにした。なぜなら、J-STAGE はもちろんだが、Google Scholar でも検索性能に不満があったからである。一番の不満は、検索でヒットした論文を開いて、必要な情報にたどり着くまでに、無駄な時間と労力が多いからである。

J-STAGE と Google Scholar を反面教師にして、まずは、学術論文検索エンジンの要件について整理して、基本設計とした。主な要件をまとめると以下の6つである。

┏━━━━━━━━━━━━━━━━━
 1. 視認性: 検索語が強調表示されること
 2. 文脈性: 検索語を含んだ文脈引用が十分にあること
 3. 一覧性: 検索結果のヒット項目が一望できること
 4. 絞込み: 検索結果項目をさらに絞り込めること
 5. 選択性: 注目した論文をマークできること
 6. 閲覧性: ワンステップでリンク先論文を閲覧できること
━━━━━━━━━━━━━━━━━━━┛

新しく構築した学術論文検索サイト NaCSE のアドレス
⇒http://www.mintap.com/nacse/nacse.html

パソコンはもちろん、タブレットやスマホでも自由に検索できる。

スマホで「コーパス」を検索した後、「著作権」で絞り込んだ様子

検索語「コーパス」は黄色で、続いて絞り込んだ「著作権」はオレンジ色でハイライトされている。

検索語を含む段落(フレーズ)だけが引用されているので、文脈のなかでの検索語の使われ方を素早く読み取ることができる。
..[↑][↓] 2
 2 質疑応答もどる
もくじへ

発表後の質疑応答は以下の通り。

Qどこの学会の論文集ですか?
A言語処理学会(NLP)です。
  
Q学会の方の協力はありましたか?
A特段の協力はありませんでした。
  
Q論文がウェブに公開されていればいいのですか?
Aはい、論文のアドレスなどが公開されていればできます。
  
Q著作権の問題はどうですか?
Aこの検索サイトを作った直接の目的は、コーパスの公開と著作権処理の実態調査でした。その調査結果はこの8月の外国語教育メディア学会全国研究大会(大阪)で発表します。調査では処理方法には7つのタイプがあることがわかりました。今回の学術論文検索サイトは論文へのリンクを貼るタイプなので著作権的には適法であることが分かりました。それで、特に連絡も取りませんでした。
  
 しかし相手がどう考えるかは分からないので、学会での研究発表を申し込みました。去年の12月のことです。そしたら、文句言われることなく発表に採用されました。今年の3月の発表当日には、学会役員の方から「学会誌論文もあるので、それもコーパスに入れてはどうですか」との提案を受けました。嫌がられるどころか、歓迎されたことになりました。(笑い)
  
 そうした経緯で今では予稿集だけでなく学会誌も検索の対象に加わっています。
  
 実は予稿集コーパスは2004年以降しか対応できていなかったのですが、その後、学会のある部門に2003年以前の資料が残っていることが判明したので、先日、情報を頂いたところです。こんな感じで学会の協力を頂いています。
  
Q他の学会の論文も対象にできますか?
Aはい、可能です。ここに、検索する論文集を選べるチェックがあります。今は2つですが、ここが増えていくわけです。
 
  
 LETの論文集にも対応できればと望んでいます。
  
..[↑] 3
2018.06.21 田淵龍二