2019/08/27 as 〜 as 考 (5) as 〜 as の共起語を調べる
|
as+原級+as(〜と同じくらい)
この as 〜 as 構文の 〜 にはどんな語彙が入るのだろうか?
それを調べるのが 共起フィルタである。
ここでは シリーズ「as 〜 as 考」の (1) 〜 に入る最多語彙は? で使った機能と手順について説明しています。
|
もくじ |
- as 〜 as の共起語を調べる
- 彩色する単語を増やす
- 共起語を素早く見つけたい
- 彩色した単語を頻度順に並び替える
- 単語の彩色を解除する
- come up with の共起語を調べる
|
|
|
検索結果について 検索語に共起して出現する語句を調べるときは、以下の手順で行う。
- 日英対訳コーパス・CORPORA をひらく
- 入力欄に as ~ as あるいは as * as を入力
- コーパスは 会話 Seleaf movies か 講演 TED Talks を選ぶ
- Enter キーを押すか、「検索」ボタンをタップする
- ヒット数と表示数を確認する
- ここでは Seleaf / as ~ as / 222 hits / 50 views となっている
- 統計的データを知りたいときは表示数が多いほど良い
- 「more」ボタンをタップ
- ヒットした222件すべてが表示される
- 統計的処理は表示した字幕に対して行われる
-
- 「options」ボタンをタップ
- 「並び替え」欄の「キー」をタップ
- 「キー」のチェックが外れて
- フィルタの「共起」に自動的にチェックが入る
- 共起フィルタがひらき
- 出現頻度の高い単語順に彩色配列される
-
- 注意: 検索語が as * as のように アスタリスク(あるいはチルダ)を含まないときには、動作が異なるので come up with の共起語を調べるを参照する
ここまでで データ収集はひと段落した。
以下、さまざまな活用などについて紹介する
|
|
共起フィルタ小窓の下段にある共起語リストのうち、彩色された部分の下にある単語を選んでタップすると、彩色されて、彩色グループに仲間入りする
仲間入りした新しい単語は、彩色グループの最上位に移動する。と同時に、その単語を含む字幕も同様に彩色されて、字幕リストの最上部に移動する。
ここでは、BAD をタップした場合を図に示した。
before
after
|
|
目的の単語が決まっているときは、絞り込みキーを使うと便利なこともある。
たとえば SAME が目的語だとして手順を示す
- 共起フィルタ小窓「絞り込みキー」の右手にある「+」をタップ
- 共起フィルタ小窓が横に広がりアルファベットボタンが現れる
- 「S」をタップすると、S で始まる単語だけが残る
左から順に step 1, 2, 3, 4
- SAME がすぐ見つかるのでタップする
|
|
彩色する単語を追加すると頻度順が乱れる。
そこで、再び頻度順に並べなおす手順を示す。
- 「clear」ボタンの右にある「+」をタップ
- 「copy」ボタンの右にある並び替えボタン(白抜きのダブルV)をタップ
左から順に step 1, 2, 3
- 降順に並び変わった
|
|
単語の彩色を解除する手順を示す
- 目的の単語をタップ
- 「×」ボタンが現れるので、それをタップ
左から順に step 1, 2, 3
- 目的の単語の彩色がはずれて、彩色グループから取り除かれる
- 「copy」ボタンの右にある並び替えボタン(白抜きのダブルV)をタップする
- 彩色を解除された字幕が、彩色グループから取り除かれる
|
|
検索語が come up with のように文字列だけの場合には、ここまでの説明した操作とは異なる。
- CORPORA を開き come up with で検索する
- ここでは 講演 TED Talks コーパスを使った例を示す
- 「more」をタップして571件すべてを表示させてから
-
- 「option」から /フィルタ の 「共起」をタップすると 共起フィルタ小窓が開く
- 共起フィルタ小窓は幅広くひらく
- 下に隠れた和訳を観たいときには 共起フィルタ小窓の「clear」の右にある「−」をタップする
-
- 共起単語列から 気になる単語を選ぶ
- ここでは 上から順に IDEA, CAN, SOLUTION, WAY の4つを選んだ
-
- 共起フィルタ小窓の「copy」の右にある「ダブルV」をタップする
右側は 圧縮して193番目(4ページ分)まで表示した図である
-
- 最初の2ページには青いマーク(IDEA)がずらりと並んでいて、その上部の左にピンクマーク(CAN)が数件ついているのが見て取れる
- これは can 〜 come up with 〜 idea の表現である
- 3ページと4ページには茶色マーク(SOLUTION)が2カ所に分かれて集まっている
- これは 上が can 〜 come up with 〜 solution の表現である
- 下は can がつかない come up with 〜 solution 表現である
- 3ページにはピンクマーク(CAN)が集まっている
- これは can 〜 come up with 表現が多いことを示している
- 4ページの下半分には紫マーク(WAY)が集まっている
- これは come up with 〜 way 表現が多いことを示している
-
ここまでの所見を表にしておく
| | | | | |
句動詞 | come up with に | よくある表現 | 度数 | 割合 | |
| | | | | |
| | | | | |
| come up with 〜 | idea | 91 | 16% | |
| | | | | |
| come up with 〜 | solution | 36 | 6% | |
| | | | | |
| come up with 〜 | way | 30 | 5% | |
| |
|
|
| |
| | 小計 | 157 | 27% | |
| |
|
|
| |
can 〜 | come up with 〜 | | 48 | 8% | |
| | | | | |
以上まとめるとつぎのようになる。
- 少なくとも TED Talks においては
- come up with に idea が来る確率が一番多く(16%)、idea, solution, way の3つで全体の27%(4分の1)を占める
- come up with に can が先行する確率は 8% である
- 何かの時に I couldn't come up with any ideas. は使えるかもしれない
|
..[↑][↓] 7 |
シリーズ 日英対訳コーパス・CORPORA / as 〜 as 考
|
..[↑] 8 |
2019.08.23 田淵龍二 TABUCHI, Ryuji
|