英語の頻出単語リスト、どれがいい?
語学は、頻出単語から効率よく学んでいくべきだと思います。
では、英語の頻出単語はどれが良いのでしょうか。
結論から言ってしまえば、現状、無料でネット公開されているもので、良さそうなものは見つかっていません。(私が知らないだけかもしれませんが。)
よく、英検の各級に合格するための、単語集が本で売っていると思います。
あれはクオリティとしてはかなり良いのではないでしょうか。
1級はエキスパートレベルだと思いますから、そこまで到達するのに学ばなくてはいけない単語が、5級から1級まで、徐々にステップアップしながら学べます。
英語を学んでいくうえで、どの単語を、どれから先に学んだら良いのか示してくれる、素晴らしい頻出単語集だと思います。
ただ、これらの本は有料です。
英検の各級のための必要単語をネットで公開している、素晴らしいページもあるにはあります。
ただ、学ぶ人が取り組みやすいようにか、大分単語数を厳選してしているようで、
5級~1級までリストアップされている単語・熟語の総数が4,800程です。
英検1級に受かるには、10,000 ~ 15,000語必要とされています。(下記サイト参照。)
では、無料で、単語数の多い頻出単語リストはないのでしょうか。
ネットで調べると、Wikipedia の頻出単語まとめで以下がすぐに出てきます。
〇TV and Movie scripts→
テレビと映画のセリフから、頻出単語4万語以上を抽出し、頻出順にリストアップ。
〇Gutenberg project→
著作権の切れた本から、頻出単語4万語を抽出し、頻出順にリストアップ。
(リンクは以下です。)
ただ、これらは2つの欠点があります。
一つは、見出し語ベースではないということです。
見出し語とは、辞書の見出しとして載っている単語、つまり単語の基本形です。
smiled と、smiles は別の単語としてカウントしています。(見出し語は同じsmile )
それはそれで意味のあるリストではあるのですが、よく英検やTOEICで、〇単語以上を覚えないと合格できない、というのは見出し語ベースだと思いますので、たとえば上記のえいらくさんのページで、英検3級には2,100語必要、と書いてあっても、Gutenberg projectは見出し語基準ではないので、どこまで覚えてよいやらわかりません。
もう一つは、ジャンルが偏っているということです。
TV and Movie scrpitsは、当然口語中心の単語集合の中から、頻出単語を抽出していると思われます。
一方、Gutenbergは、本から持ってきているので、文語中心になっていると思います。また、著作権の切れた古い本から持ってきているので、Thyなどの現代はもう使わない単語が頻出リストのかなり上の方に来てしまっている問題も指摘されています。
このTV and Movie scrpitsと、Gutenberg、例えば各々が頻出単語5,000語として挙げている単語が、どれくらい共通しているか、エクセルで関数で調べてみました。
結果、両者に共通して出てくる単語は、2,936単語(59%)しかありませんでした。6割です。
両者がどちらも見出し語ベースのリストであれば、もう少しかぶりは高かったかもしれませんが、いずれにせよ、どういうジャンルの単語集合から頻出語を抜き出すか、で頻出単語リストは大きく異なってくる様です。
ネットで公開されている、見出し語ベースで、ジャンルごとの特性も加味して頻出単語リスト(6万語)を作っているのが、以下のページです。
今のところ最強だと思われますが、しかし、頻出単語リストは有料です。
優良なものは有料、仕方ない気はしますが、無料で良さそうなものが見つからない状況です。
(読んでいただいたのに、役に立たない結論ですみません。)
語学はリスニングで最後まで苦労する(苦労した)。。。
語学の目的は、人各々だと思います。
だから、各々の目的を満たす様に勉強すればよいと思います。
ある言語で論文を読むことが目的ならば、リスニングの勉強は不要だと思います。
でも、ある程度ネイティブと口頭で会話がしたい、と思っている人が大半なのではないでしょうか。もしそれが目的の一つなら、リスニングの勉強は不可欠です。
自分の経験では、英語でも、ドイツ語でも、最後まで苦労しているのは、結局リスニングです。いまだに、しゃべる、書く、読むに比べて、一番苦手意識が高いです。
そしてそれはやっぱり、読み書きを中心に勉強してきてしまったからだと思います。
読んで単語がわかる、つまり目で見て、意味を脳が認識できるのと、
聞いて単語がわかる、つまり耳で聞いて、意味を脳が認識できるのは、
違う訓練が必要です。
リスニングができる様になるには、読む練習をしていてはダメで、音を聞いて、それを脳が意味と結び付ける訓練をしないといけません。
もちろん、読む、聞くの「インプット」とは別に、しゃべる、書く、の「アウトプット」の練習は必要です。でもこちらは、しゃべる練習をしておけば書けるし、書く練習をしておけば、しゃべれると思います。
無論、中国語の様に、書けてもしゃべれない(漢字は日本人なのでかけるが、発音の四声は別途練習して覚えないと喋れない)とか、タイ語の様に言えても書けない(同じ発音の子音でも複数あり、単語ごとに綴りをきちんと覚えないといけない)ものもあるとは思いますが、発音に特に注意が必要な言語以外は、大体は書く練習をしておけば、喋れると思います。
一方で、どんな言語でも、聞く練習だけは、読みでカバーできないのではないでしょうか。読みで知っている単語でも、ネイティブに素早く発音されると、脳がついていけないので聞き取れません。別途訓練が必要です。
つまり、リスニングの練習だけは、絶対に必要不可欠です。他の読む、書く、喋るの練習でカバーできません。
(当たり前のことを偉そうに言っていますが。。。)
で、リスニングの練習をする時には、スクリプトが必要です。
他の記事でも書いていますが、スクリプトなしでただ漫然とネイティブの会話を聞いていても、聞き取れる様にはなりません。
ネイティブの会話を聞く→聞き取れないので、何と言っているのか、スクリプトを見る→ああ、この単語は、この慣用句は、こうやって聞こえるのか、と理解する→意識してもう一度聞いてみる。→次から、同じ音を聞いたときに、脳が意味と結び付けて理解できる。
この繰り返しが、リスニング能力を上げていくのだと思います。
だから、スクリプト付きのもの(且つネイティブがナチュラルにしゃべるもの)を教材として使うべきだと思います。
そこまではいいとして、実際スクリプト付きのものでリスニングの勉強をしてみると、終わりが見えなくて愕然とするとは思います。
聞き取れなくて、スクリプトを見て、再度聞き取る練習すれば、その単語や、慣用句は、次から出てきた時には聞き取れる様になります。
でも、また別の、聞き取れない単語や慣用句などの表現に出会います。
それもスクリプトを見て、また聞き取れるようになりますが、更にまた別の、聞き取れない部分に出会います。。。。
「いつまで続けたら、大体全部聞き取れる様になるのだろう?」と思うと思います。
まあそれでも続けるしかないですね。
ただ、今の時代は、いろいろ便利なものがあります。
膨大なスクリプト付きのリスニング教材をプログラミングで分析し、ネイティブが頻繁に使う単語や慣用句を、最も効率よくカバーするには、どのリスニング教材を聞けば良いのか、ピックアップできます。
あまり出てこないような単語(例:グリチルリチン酸ジカリウム)まで聞き取れる様に訓練する必要はなく、頻出する単語や慣用句を聞き取れる様になれば、大体リスニングはできる様になったと言えるのではないでしょうか。
以下のサイトで、少しずつ各言語のリスニング教材を分析し、効率よく学べるものをピックアップして掲載していきたいと思います。
【ついに見つけた】ナチュラルなスペイン語のリスニング練習に使えるpodcast
語学のゴールをどこに置くか、は人各々の目的によって異なっていいと思う。
その中で、自分としては、スペイン語もいつかは、英語やドイツ語と同じように、ネイティブと大体普通に会話できるし、テレビやラジオを見たり聞いたりした時には、ネイティブ同士が喋っていることも大体わかる様になりたい。(ネイティブどうしの会話を聞いて大体わかるのは、かなり語学のゴールとしてはハードルが高いと思うけど。英語やドイツ語でも現地で留学や仕事を何年した後でも、結構未だに苦労している。。。)
だけど、その為にはいい教材が必要だ。
いい教材というのは、
①ネイティブが普通のスピードでナチュラルにしゃべっていて、
②そのスクリプトがある
ものだと思う。
Podcastなんかでも、ネイティブが非常にゆっくり、簡単な単語だけを発音しているものは結構ある。でも、それを聞いていても、ナチュラルなスペイン語は聞き取れる様にならないと思う。(もちろん、最初のリスニングのとっつきとしては、ものすごく意味のある教材だと思うけど。)
一方で、スペイン語のネイティブが、普通にペラペラしゃべっているだけのPodcastを聞いても、スクリプトがなければ、何のリスニングの勉強にもならない。
まずネイティブのナチュラルな喋りを聞いてみる
↓
聞き取れない
↓
スクリプトを見る
↓
ああ、こう言っていたのか、とわかる
↓
もう一度意識して聞いてみる
↓
次からは同じような音を聞いたときに、脳がすっと意味のある音として理解できるようになる。
このサイクルが大事なのだと思う。スクリプトがないまま、正解がわからずいくら聞いていても、聞き取れる様にはならないと思う。
で、この
①ネイティブが普通のスピードでナチュラルにしゃべっていて、
②そのスクリプトがある
という2つの条件を満たすPodcastを昔から探していたが、どうも見つからないで困っていた。(自分の探し方が悪かっただけかもしれないけど。)
ところが今日、スペイン語のいろんなポッドキャストをまとめた以下を見ていたら、、、、
あったんです。
それがこちら↓
これすごいわ。
ものすごいエピソードの数!
エピソードの検索もできる。
エピソードのタイトルをクリックすると、各々のエピソードのページに飛びます。
(タイトルではなく、再生ボタンを押してしまうと、各々のエピソードのページに行かずに音声だけ再生されてしまうので、注意。)
で、各々のエピソードのページへ行って、
Puedes leer la transcripción del episodio
をクリックすると、スクリプトがばっちり現れる。
このサイトを運営している人に、本当感謝しかないと思う。
スクリプトを準備するのって、ものすごい大変なはず。
自分にはまだ早いけど、2,000 語以上ばっちり覚えたら、このサイトでリスニングの練習していきたい。
また追ってプログラミングで、頻出単語5,000 語や、10,000 語、よくある慣用句などを効率よく聞き取りから覚えられるように、エピソードを分析して抽出したいと思っています。
(ちなみに僕のサイトはこちら。いろいろな言語のリスニングを、効率よく学べる曲や動画、podcast をプログラミングでピックアップしています。)
ドイツ留学は最高のトラウマ
昨日、ドイツ語のリスニング教材として、Direkt aus Europa auf Deutsch を紹介したら、意外にも見てくださった方も結構いるみたいで、ドイツ留学を目指している方も世の中にはまだまだいるのかな、と嬉しくなりました。
(Direkt aus Europa auf Deutsch のスクリプトはまたいずれプログラミングで分析して、重要単語5,000 語や、よくあるフレーズなどのヒアリングを効率よく練習するにはいつの回を聞けば良いか、調べて発表したいと思っています。)
ドイツ留学を目指している方が読んでくださっているかもしれないので、時々昔の留学の思い出を書こうかな、と思います。自分自身とても懐かしいし、それが誰かの為になるなら最高です。
自分の様にドイツでDiplom まで取得した日本人は、結構な少数派だと思います。レアな経験なので、誰かの役に立てれば、と思います。
何から書いていいかわからないけど、どうしても言いたいのは、Diplom (自分はVWL:Volkswirtschaftslehre 経済学でした)を取るのは、死ぬほど大変でした。
今でもトラウマになっています。
でも、ドイツ留学で、文字通り一皮むけたというか、人間が強くなって、自分の人格が完全に変わったと思っています。(親に感謝です。)最高の経験でした。ドイツ留学を目指している人は、是非実現してほしい。
トラウマというのは、本当にそうです。
何せ勉強することが多い。
日本の大学の様に、入学は難しくて、卒業が簡単、ではありません。
ドイツは、国の試験に受かればどの大学でも入れます。でも、本当によく勉強しないと、卒業できません。沢山の人が、卒業できずにやめていきます。
数多くの単位を取らなくてはならず、単位を取るために、英語やらドイツ語でひたすら論文を読むことになります。
一週間で大体3、400ページくらいは少なくとも読む感じです。一日中読んでいました。
そして怖いのは、学期の最後に、試験を申込んで、落とすと(もしくは棄権すると)、Maluspunkt という罰がつきます。これが確か5個たまると、強制退学です。
では自信のある科目だけ試験を申込めば良いかというと、もちろんそうですが、そんなことしていたら、いつ卒業できるかわかりません。
夏学期にしかない単位、冬学期にしかない単位もあり、下手をすると一個試験を見送ると、簡単に卒業が1年延びます。
ドイツのDiplom は、日本やアメリカで言う学士課程~修士課程修了までを包含したもので、取得するとその上がもう博士課程になります。僕は日本で4年生の大学を出ていたので、その単位をまず移行しましたが(従いやったのは言ってみれば修士課程の部分だけ)、それでもDiplom 取得まで4年かかりました。(最初の1年は授業出ても、全くついていけないので、単位は取れません。その意味では、少しついていける様になってから3年かかりました。)
早く卒業したい、でも焦って試験を受けると、Maluspunkt が5個に達して、強制退学。すべてがパーになる。
このぎりぎりのストレスの中で、4年間戦い続けました。
(とにかく一単位とるのに理解すべきことが多すぎて、毎日論文や教科書読みっぱなしの上、試験前日はほぼ徹夜。)
これがどれくらい精神をすり減らしたかというと、卒業してからもう15年以上経つのですが、今でも時々夢に見てうなされるくらいです。
「ああ、自分は日本にいて、企業で働いてなんているけど、まだドイツでとっていない単位がある。明日が試験なんだ。早く勉強して、ドイツに戻って試験受けないと、また卒業が遠のく。」そうやって汗かいてうなされて目が覚めて、自分はもうとっくの昔にDiplom を取得して日本に帰ってきたんだと現実を理解して、ホッと安心することが、今でも時々あります。
でも、トラウマだけど、最高の時間でした。
自分はドイツで人間が変わったと思います。強くなったと思います。
ドイツ人て、日本人と似て、真面目だけど、それだけじゃなくて、日本人に比べて、「自分はこうありたい」という信念みたいなものが強い気がします。
日本人は、自分の意見を言うことや、自分のやりたいことをやるのに、恥ずかしいとか、周りの目を気にすると思います。
でも、ドイツ人は、「自分はこう思う。だからこう行動する」というのがあって、人目を気にせずに、自分が信じた行動をとる気がします。(それで真面目で正義感あって、やさしいから、最強です。)
ホロコーストを反省するドイツ人。世界に先駆けて環境問題や自然エネルギーに取り組んだドイツ人。道を歩いて渡ろうとすると、すぐ車が止まってくれるドイツ人。真面目なだけじゃなくて、自分の信じたことを恥ずかしがらずに素直に言う、行動に移せる人たちにあこがれて、自分も性格がガラリと変わったと思います。
もちろん、日本人として、空気読むとか、オブラートにある程度包んでモノ言うとか、そういう部分は今でもとても大事にしていますが、それでも周りが何と言おうと自分の思う通りに行動しようという人間になれたのは、経済学とか、ドイツ語とか以上に、ドイツで何かもっと大事なことを学んだ気がします。
ドイツ留学を目指す方におススメのリスニング教材
僕と同じように、ドイツに留学したいと思っている人もいると思います。
リスニングは、本当によく準備していった方が良いと思います。
向こうへ行ってから苦労します(最初はとにかく会話という会話が聞き取れなくて、精神的にやられます)。
そして、留学してからも、とにかく努力しないと、リスニングは上達しません。
僕はドイツでDiplom を取得して卒業しましたが、今でもリスニングは苦手です。
たゆまぬ努力が必要です。
努力するといっても、ただ聞いていても、上手くはなりません。
スクリプトがある教材が必要です。
聞いてみて、聞き取れない部分は、実際は何と言っていたのか、スクリプトを見て理解することで、次からその音を聞いたときに、理解できるようになります。
スクリプトがなく、つまり、正解がなく、なんとなく聞き流してテレパシーで「こう言っているはず」と理解しても、それは自分勝手な想像をする力がついているだけで、リスニング能力は上がっていません。
生のドイツ語を聞いて、それにスクリプトがついてくる。そんな教材があります。
Direkt aus Europa auf Deutsch
というものです。
ドイツのラジオ放送などを1時間録音して、スクリプトをつけたものです。
毎月一回出ます。
最後に聞き取りの練習問題(Uebungsaufgabe)もついています。
これ、僕が若い頃、ドイツ留学を準備していた頃は、本屋さんで売っていました。
飛鳥洞という出版社が出していて、カセットテープにスクリプトがついて、
毎月3,000~4,000 円くらいだったと思います。毎月毎月買って、毎晩聞きながら寝ていました。
これ、もう本屋さんで見ないし、きっとなくなってしまったんだろうなあ、とずっと思っていましたが。。。。
ネットで無料で公開しているじゃないですか!
但し、無料といえど、やはり作る人の手間はかかるので、「1月1,000 円、もし寄付してくれたらありがたい」とのことです。是非そうしたいです。
ネットに公開されているページはこちら。
http://aufdeutsch.news.coocan.jp/
このページに行っても、よくわからないかもしれません。
ページの下の方に行き、
- Nr. 287 (Januar 2005) - Nr. 388 (Juni 2013)
- Nr. 389 (Juli 2013) - Nr. 471 (Mai 2020)
- Nr. 472 (Juni 2020)
と書いてあるところをクリックして頂くと、ネットにアップされた各号の録音と、スクリプト(PDF)にたどり着くことができます。膨大な量です。
これ、本当に見つけたときは狂喜しました。
自分が留学準備するのにとても役にたった教材です。
(これなかったら、渡独してすぐにDSH合格しなかったと思います。)
スクリプトを用意するのは、大変な手間がかかると思います。
(この教材、実はスクリプトだけでなく、難しい用語の脚注も充実しています。)
これを未だに制作し続けてくれている人がいることに、感謝の念が堪えません。
ドイツ留学を目指している方、留学中の方、リスニングを鍛えるために、是非聞いてみてはいかがでしょうか。(Direkt aus Europa auf Deutschが世の中から無くなると困るので、寄付も是非お願いします。)
これ、確か昔、ドイツ語と並んで、フランス語のもあったんだよな。
探してみよう。。。
日本人は英語が得意
何個か前の記事で、将来、世界のみんなが数か国語ペラペラになったらなあ、みたいなことを書いた。
(「藤子不二雄と語学」という記事だと思う。)
でも日本に目を向けてみると、実際は英語だけでも苦手意識のある人の方が、圧倒的に多いと思う。特に、会話となると、多くの人が苦手ではないか。
英語や語学が好きで、日々これらを学んでいるような人は得意だろうけど、あくまでも少数派だろう。
街中でアメリカ人に英語で話しかけられたら、逃げだしたくなる日本人の方が断然多いのではないだろうか。
自分の会社でも、英語の契約書は読んで理解できるけど、会話になると、単語を一言、二言発するのが精いっぱいの人は多い。
でも、本当は日本人は皆、英語が得意なのだと思う。
会話ができるのだと思う。
「やればできる」ことに気づいていないだけではないか、といつも思う。
前にも紹介したけど、Globish 1,500語というのがある。
この1,500 語を知っていれば、基本的な意思疎通はできるといわれている。
1,500 語も覚えるの大変だ!と思う人もいるかもしれない。
だけど、日本にはカタカナで相当英単語が入り込んでいる。
日本人は、もともとかなりの英単語を知っているのだ。
試しにその1,500 語の中で、カタカナで日本語として普及しているものを数えてみた。
この記事の最後に載せておくが、かなり厳しめに見ても、1,500のうち、少なくとも766個(フラグを立てたもの)は日本語として普通に使われている。
社会人になればなるほど外来語は使っているような印象があり、実際自分の仕事の現場で使われているものも含めると、1,000 語くらいはある感触だ。つまり、日本人は、意思疎通に必要な英単語を、最初からかなりの部分、知っている。
これに英語を学校で習うのだから、日本人は皆十分な語彙力があるはずだ。
(仮に学校で習ったことを忘れてしまっている人も、1,500のうち760しっているなら、残りを覚えるのはそんなに大変ではないと思う。)
その上で、「自分は、言いたいことは一応言えるだけの語彙力がある」と信じると、苦手意識がなくなり、普通に英語が喋れだすと思う。(細かい文法は完璧でなく、表現も繊細でなくとも。)
僕自身も、日本生まれ、日本育ちで、高校の頃は、英会話の授業でアメリカ人の先生に指名されると、焦りながら単語を一つ、二つひねり出すだけだった。
でも大学生のころに、意識を変えてから、急にしゃべれるようになった記憶がある。
「簡単な単語でかなり喋れる」と気づいてから、英会話の苦手意識が全くなくなった。
その後大人になって、アメリカに住んで、今があるけど、今でも自分の使う英単語は、殆ど中学で習う、基本レベルのものだと思う。(Globish 1,500 に近いという感覚。)
英語とか、英会話って、帰国子女とか、膨大な時間勉強した人だけができる敷居の高いものではない筈だ。(もちろん、時間をかければかけただけ、上達するものでもあると思う。)
若干極論かもしれないが、ほとんどの日本人は、英語が喋れないのではなく、「喋れないと思い込んでいるだけ」だろう。喋るに必要な語彙は、かなり知っている。
1,500 の語彙を確認した上で、チャットサイトかなんかで外国人とチャットしてみるといい。かなり会話できることに気づくのではないだろうか。
(終わり)
以下、Globish 1,500 語。カタカナとして日本語に入っているものにフラグ1 をマーク。
a | |
able | |
about | |
above | |
accept | 1 |
according | |
account | 1 |
accuse | |
achieve | |
across | |
act | 1 |
adapt | |
add | |
admit | |
adult | 1 |
advertisement | |
advise | 1 |
affect | |
afraid | |
after | 1 |
again | |
against | 1 |
age | |
agency | 1 |
ago | |
agree | |
ahead | |
aid | 1 |
aim | |
air | 1 |
alive | |
all | 1 |
allow | |
ally | |
almost | |
alone | 1 |
along | |
already | |
also | |
although | |
always | 1 |
among | |
amount | |
and | 1 |
anger | |
angle | 1 |
announce | 1 |
another | 1 |
answer | 1 |
any | |
apartment | 1 |
apologize | |
appeal | 1 |
appear | |
apple | 1 |
apply | |
appoint | 1 |
approve | |
area | 1 |
argue | |
arm | 1 |
army | 1 |
around | |
arrest | |
arrive | |
art | 1 |
as | |
ask | |
assist | 1 |
at | |
attach | 1 |
attack | 1 |
attempt | |
attend | |
attention | 1 |
authority | |
automatic | 1 |
autumn | 1 |
available | |
average | 1 |
avoid | |
awake | |
award | 1 |
away | |
baby | 1 |
back | 1 |
bad | 1 |
bag | 1 |
balance | 1 |
ball | 1 |
ballot | |
ban | |
bank | 1 |
bar | 1 |
barrier | 1 |
base | 1 |
basket | 1 |
bath | 1 |
battle | 1 |
be | 1 |
bear | |
beat | 1 |
beauty | 1 |
because | |
become | |
bed | 1 |
beer | 1 |
before | |
begin | 1 |
behind | |
believe | 1 |
bell | 1 |
belong | |
below | |
bend | |
beside | |
best | 1 |
betray | |
better | 1 |
between | |
big | 1 |
bill | |
bird | 1 |
birth | 1 |
bit | 1 |
bite | |
black | 1 |
blade | 1 |
blame | |
blank | 1 |
blanket | 1 |
bleed | |
blind | 1 |
block | 1 |
blood | 1 |
blow | |
blue | 1 |
board | |
boat | 1 |
body | 1 |
bomb | 1 |
bone | 1 |
bonus | 1 |
book | 1 |
boot | 1 |
border | 1 |
born | |
borrow | |
boss | 1 |
both | |
bottle | 1 |
bottom | 1 |
box | 1 |
boy | 1 |
boycott | 1 |
brain | 1 |
brake | 1 |
branch | 1 |
brave | 1 |
bread | 1 |
break | 1 |
breathe | |
brick | |
bridge | 1 |
brief | 1 |
bright | |
bring | |
broad | 1 |
broadcast | 1 |
brother | 1 |
brown | 1 |
brush | |
budget | 1 |
build | |
bullet | 1 |
burn | |
burst | 1 |
bury | |
business | 1 |
busy | 1 |
but | 1 |
butter | 1 |
button | 1 |
buy | 1 |
by | |
cabinet | |
call | 1 |
calm | |
camera | 1 |
camp | 1 |
campaign | 1 |
can | 1 |
cancel | 1 |
capture | 1 |
car | 1 |
card | 1 |
care | 1 |
carriage | |
carry | 1 |
case | 1 |
cash | 1 |
cat | 1 |
catch | 1 |
cause | |
celebrate | 1 |
cell | 1 |
center | 1 |
century | 1 |
ceremony | 1 |
certain | |
chain | 1 |
chair | 1 |
chairman | |
challenge | 1 |
champion | 1 |
chance | 1 |
change | 1 |
channel | 1 |
character | 1 |
charge | 1 |
chart | 1 |
chase | |
cheap | 1 |
check | 1 |
cheer | 1 |
cheese | 1 |
chemical | 1 |
chest | |
chief | 1 |
child | 1 |
choose | |
church | |
circle | 1 |
citizen | 1 |
city | 1 |
civilian | |
claim | 1 |
clash | 1 |
class | 1 |
clean | 1 |
clear | 1 |
climate | |
climb | |
clock | |
close | 1 |
cloth | |
cloud | 1 |
coal | |
coast | 1 |
coat | 1 |
code | 1 |
cold | 1 |
collect | 1 |
college | 1 |
colony | 1 |
color | 1 |
combine | |
come | 1 |
comfort | |
command | 1 |
comment | 1 |
committee | 1 |
common | |
communicate | 1 |
community | 1 |
company | 1 |
compare | |
compete | |
complete | 1 |
compromise | |
computer | 1 |
concern | |
condemn | |
condition | 1 |
conference | 1 |
confirm | 1 |
congratulate | 1 |
congress | |
connect | 1 |
consider | |
consumption | |
contact | 1 |
contain | |
continent | |
continue | 1 |
control | 1 |
cook | 1 |
cool | 1 |
cooperate | |
copy | 1 |
cork | |
corn | |
corner | 1 |
correct | |
cost | 1 |
cotton | 1 |
count | 1 |
country | 1 |
course | 1 |
court | |
cover | 1 |
cow | |
crash | |
create | 1 |
credit | 1 |
crew | 1 |
crime | |
crisis | 1 |
criteria | 1 |
criticize | |
crop | |
cross | |
crowd | |
crush | |
cry | 1 |
culture | 1 |
cup | 1 |
cure | |
current | 1 |
custom | 1 |
cut | 1 |
damage | 1 |
dance | 1 |
danger | 1 |
dark | 1 |
date | 1 |
daughter | |
day | 1 |
dead | 1 |
deaf | |
deal | |
dear | 1 |
debate | 1 |
debt | |
decide | |
declare | |
decrease | |
deep | 1 |
defeat | |
defend | 1 |
define | |
degree | |
delay | |
delicate | 1 |
deliver | 1 |
demand | 1 |
demonstrate | 1 |
denounce | |
deny | |
departure | 1 |
depend | |
deploy | 1 |
depression | |
describe | |
desert | |
design | 1 |
desire | |
destroy | 1 |
detail | 1 |
develop | |
device | 1 |
die | 1 |
diet | 1 |
differ | |
difficult | |
dig | |
dinner | 1 |
diplomat | |
direct | 1 |
dirt | |
disappear | |
discover | 1 |
discuss | 1 |
disease | |
disk | 1 |
dismiss | |
dispute | |
distance | |
divide | |
do | |
doctor | 1 |
document | 1 |
dog | 1 |
door | 1 |
doubt | 1 |
down | 1 |
drain | |
draw | |
dream | 1 |
dress | 1 |
drink | 1 |
drive | 1 |
drop | 1 |
drug | 1 |
dry | 1 |
during | |
dust | |
duty | |
each | |
ear | 1 |
early | |
earn | |
earth | 1 |
east | 1 |
easy | 1 |
eat | 1 |
edge | 1 |
education | |
effect | 1 |
effort | |
egg | 1 |
either | |
elastic | |
electricity | |
element | 1 |
else | |
embassy | |
emergency | |
emotion | 1 |
employ | |
empty | |
end | 1 |
enemy | |
enforce | |
engine | 1 |
enjoy | 1 |
enough | |
enter | |
entertain | 1 |
environment | |
equal | 1 |
equate | |
equipment | |
erase | |
escape | 1 |
especially | |
establish | |
estimate | |
ethnic | 1 |
evaporate | |
even | |
event | 1 |
ever | |
every | |
evidence | 1 |
evil | |
exact | |
example | |
except | |
exchange | |
excuse | |
execute | |
exercise | 1 |
exist | |
exit | 1 |
expand | |
expect | |
expense | |
experience | |
experiment | |
expert | 1 |
explain | |
explode | |
explore | |
export* | |
express | 1 |
extend | |
extra | 1 |
extreme | 1 |
eye | 1 |
face | 1 |
fact | 1 |
factory | 1 |
fail | |
fair | 1 |
fall | |
false | |
family | 1 |
famous | |
far | |
fast | 1 |
fat | 1 |
father | |
fear | |
feather | 1 |
feature | 1 |
feed | |
feel | |
female | |
fertile | |
few | |
field | 1 |
fierce | |
fight | 1 |
figure | 1 |
file | 1 |
fill | |
film | 1 |
final | 1 |
finance | 1 |
find | 1 |
fine | |
finger | |
finish | 1 |
fire | 1 |
firm | |
first | 1 |
fish | 1 |
fist | |
fit | 1 |
fix | 1 |
flag | 1 |
flat | 1 |
float | 1 |
floor | 1 |
flow | |
flower | 1 |
fluid | |
fly | 1 |
fog | 1 |
fold | |
follow | 1 |
food | 1 |
fool | |
foot | 1 |
for | |
forbid | |
force | 1 |
foreign | |
forest | |
forget | |
forgive | |
form | 1 |
former | |
forward | |
frame | 1 |
free | 1 |
freeze | 1 |
fresh | 1 |
friend | 1 |
frighten | |
from | |
front | 1 |
fruit | 1 |
fuel | |
full | 1 |
fun | 1 |
future | |
gain | |
gallon | |
game | 1 |
gang | 1 |
garden | 1 |
gas | 1 |
gather | |
general | 1 |
gentle | 1 |
get | 1 |
gift | 1 |
girl | 1 |
give | 1 |
glass | 1 |
global | 1 |
go | |
goal | 1 |
god | 1 |
gold | 1 |
good | 1 |
govern | |
grass | |
gray | 1 |
great | 1 |
green | 1 |
ground | 1 |
group | 1 |
grow | |
guarantee | 1 |
guard | 1 |
guess | 1 |
guide | 1 |
guilty | |
gun | 1 |
guy | 1 |
hair | 1 |
half | 1 |
halt | |
hand | 1 |
hang | |
happen | |
happy | 1 |
hard | 1 |
harm | |
hat | |
hate | 1 |
have | |
he | |
head | 1 |
heal | 1 |
health | 1 |
hear | |
heart | 1 |
heat | |
heavy | 1 |
help | 1 |
her | |
here | |
hide | |
high | 1 |
hijack | 1 |
hill | |
him | |
hire | 1 |
his | |
history | 1 |
hit | 1 |
hold | 1 |
hole | 1 |
holiday | 1 |
hollow | |
holy | |
home | 1 |
honest | |
hope | |
horrible | |
horse | 1 |
hospital | 1 |
hostage | |
hostile | |
hot | 1 |
hour | 1 |
house | 1 |
how | |
however | |
huge | |
human | 1 |
humor | 1 |
hunger | |
hunt | |
hurry | |
hurt | |
husband | |
I | |
ice | 1 |
idea | 1 |
identify | |
if | |
ill | |
imagine | |
import | 1 |
important | |
improve | |
in | |
inch | 1 |
incident | |
include | |
increase | |
independent | |
indicate | |
individual | |
industry | 1 |
infect | |
influence | 1 |
inform | |
inject | |
injure | |
innocent | 1 |
insane | |
insect | |
inspect | |
instead | |
insult | |
insurance | |
intelligence | 1 |
intense | |
interest | |
interfere | |
international | 1 |
into | |
invade | 1 |
invent | |
invest | |
investigate | |
invite | |
involve | |
iron | 1 |
island | 1 |
issue | 1 |
it | |
item | 1 |
jacket | 1 |
jail | |
jewel | 1 |
job | 1 |
join | |
joint | 1 |
joke | 1 |
joy | |
judge | 1 |
jump | 1 |
jury | |
just | 1 |
keep | |
key | 1 |
kick | 1 |
kid | 1 |
kill | |
kind | |
king | 1 |
kiss | 1 |
kit | |
kitchen | 1 |
knife | 1 |
know | |
labor | |
laboratory | |
lack | |
lake | |
land | 1 |
language | |
large | |
last | 1 |
late | |
laugh | |
law | |
lay | |
lead | |
leak | |
learn | |
least | |
leave | |
left | 1 |
leg | |
legal | 1 |
lend | |
length | |
less | 1 |
let | |
letter | 1 |
level | 1 |
lie | |
life | 1 |
lift | 1 |
light | 1 |
like | |
limit | 1 |
line | 1 |
link | 1 |
lip | 1 |
liquid | 1 |
list | 1 |
listen | |
little | 1 |
live | |
load | |
loan | 1 |
local | 1 |
locate | |
lock | |
log | |
lone | |
long | 1 |
look | 1 |
loose | 1 |
lose | |
lot | |
loud | |
love | 1 |
low | |
luck | 1 |
magic | 1 |
1 | |
main | 1 |
major | 1 |
make | |
male | |
man | 1 |
manufacture | 1 |
many | |
map | 1 |
march | 1 |
mark | 1 |
market | 1 |
marry | |
master | 1 |
match | 1 |
material | 1 |
matter | |
may | |
mayor | |
me | |
meal | |
mean | |
measure | |
meat | |
media | 1 |
meet | |
member | 1 |
memory | 1 |
mental | 1 |
mercy | |
message | 1 |
metal | 1 |
meter | 1 |
method | |
middle | 1 |
might | |
mile | |
military | 1 |
milk | 1 |
mind | 1 |
mine | |
minister | |
minor | 1 |
miscellaneous | |
miss | 1 |
mistake | 1 |
mix | 1 |
mob | |
model | 1 |
moderate | |
modern | 1 |
money | 1 |
month | |
moon | |
moral | 1 |
more | |
morning | 1 |
most | |
mother | |
motion | |
mountain | 1 |
mouth | |
move | |
much | |
murder | |
muscle | 1 |
music | 1 |
must | |
my | |
mystery | 1 |
nail | 1 |
name | 1 |
narrow | |
nation | |
native | 1 |
navy | 1 |
near | |
necessary | |
neck | 1 |
need | |
neighbor | |
neither | |
nerve | |
neutral | 1 |
never | |
new | 1 |
news | 1 |
next | 1 |
nice | 1 |
night | |
no | |
noise | 1 |
noon | |
normal | 1 |
north | 1 |
nose | |
not | |
note | 1 |
nothing | |
notice | |
now | |
nowhere | |
number | 1 |
obey | |
object | 1 |
observe | |
occupy | |
occur | |
of | |
off | 1 |
offensive | |
offer | 1 |
office | 1 |
officer | |
often | |
oil | 1 |
old | |
on | |
once | |
only | 1 |
open | 1 |
operate | 1 |
opinion | |
opportunity | |
opposite | |
oppress | |
or | |
order | |
organize | |
other | |
ounce | |
our | |
ours | |
oust | |
out | 1 |
over | 1 |
owe | |
own | |
page | 1 |
pain | |
paint | 1 |
pan | |
pants | 1 |
paper | 1 |
parade | 1 |
parcel | |
parent | |
parliament | |
part | 1 |
party | 1 |
pass | 1 |
passenger | |
past | |
paste | 1 |
path | |
patient | |
pattern | 1 |
pay | |
peace | 1 |
pen | 1 |
pencil | 1 |
people | |
percent | 1 |
perfect | 1 |
perform | |
perhaps | |
period | 1 |
permanent | 1 |
permit | |
person | |
physical | 1 |
pick | |
picture | 1 |
piece | |
pig | |
pilot | 1 |
pint | 1 |
pipe | 1 |
place | |
plain | |
plan | 1 |
plane | |
plant | 1 |
plastic | 1 |
plate | |
play | |
please | |
plenty | |
1 | |
point | 1 |
poison | |
policy | 1 |
politics | |
pollute | |
poor | |
popular | 1 |
port | |
position | 1 |
possess | |
possible | |
postpone | |
potato | 1 |
pound | 1 |
pour | |
powder | 1 |
power | 1 |
practice | |
praise | |
pray | |
pregnant | |
present | 1 |
press | 1 |
pretty | |
prevent | |
price | 1 |
1 | |
prison | |
private | 1 |
prize | |
problem | 1 |
process | 1 |
product | 1 |
professor | |
profit | |
program | 1 |
progress | |
project | 1 |
property | |
propose | 1 |
protect | 1 |
protest | |
prove | |
provide | |
public | 1 |
publish | |
pull | |
punish | |
purchase | |
pure | 1 |
purpose | |
push | |
put | |
quality | 1 |
quart | |
quarter | 1 |
queen | 1 |
question | |
quick | 1 |
quiet | |
quit | |
quite | |
race | 1 |
radiation | |
raid | |
rail | 1 |
rain | 1 |
raise | |
range | |
rare | 1 |
rate | |
rather | |
ray | |
reach | 1 |
react | 1 |
read | |
ready | 1 |
real | 1 |
reason | |
receive | 1 |
recognize | |
record | 1 |
recover | 1 |
red | 1 |
reduce | |
refugee | |
refuse* | |
regret | |
regular | 1 |
reject | |
relation | |
release | 1 |
remain | |
remember | |
remove | |
repair | 1 |
repeat | 1 |
report | 1 |
represent | |
request | 1 |
require | |
rescue | 1 |
research | 1 |
resign | |
resist | |
resolution | |
resource | 1 |
respect | 1 |
responsible | |
rest | 1 |
restrain | |
result | |
retire | |
return | 1 |
revolt | |
reward | |
rice | 1 |
rich | 1 |
ride | 1 |
right | |
ring | 1 |
riot | |
rise | |
risk | 1 |
river | 1 |
road | 1 |
rob | |
rock | 1 |
rocket | 1 |
roll | 1 |
roof | |
room | 1 |
root | |
rope | 1 |
rough | 1 |
round | 1 |
row | |
rub | |
rubber | |
ruin | |
rule | 1 |
run | |
sad | |
safe | 1 |
sail | |
salt | |
same | |
sand | 1 |
satisfy | |
save | 1 |
say | |
scale | 1 |
scare | |
school | 1 |
science | 1 |
score | 1 |
script | 1 |
sea | |
search | 1 |
season | 1 |
seat | 1 |
second | 1 |
secret | 1 |
section | 1 |
security | 1 |
see | |
seed | |
seek | |
seem | |
seize | |
seldom | |
self | 1 |
sell | |
senate | |
send | |
sense | 1 |
sentence | 1 |
separate | |
series | 1 |
serious | 1 |
serve | |
set | |
settle | |
several | |
severe | 1 |
sex | 1 |
shade | 1 |
shake | |
shall | 1 |
shame | |
shape | 1 |
share | 1 |
sharp | 1 |
she | |
sheet | 1 |
shelf | |
shell | 1 |
shelter | 1 |
shine | |
ship | 1 |
shirt | 1 |
shock | 1 |
shoe | 1 |
shoot | 1 |
shop | 1 |
short | 1 |
should | |
shout | 1 |
show | 1 |
shrink | |
shut | |
sick | |
side | 1 |
sign | 1 |
signal | 1 |
silence | 1 |
silk | 1 |
silver | 1 |
similar | |
simple | 1 |
since | |
sing | |
single | 1 |
sister | |
sit | |
situation | 1 |
size | 1 |
skill | 1 |
skin | 1 |
skirt | 1 |
sky | 1 |
slave | |
sleep | 1 |
slide | 1 |
slip | 1 |
slow | 1 |
small | 1 |
smart | 1 |
smash | 1 |
smell | |
smile | 1 |
smoke | 1 |
smooth | 1 |
snack | 1 |
snake | |
sneeze | |
snow | 1 |
so | |
soap | 1 |
social | 1 |
society | |
soft | 1 |
soil | |
soldier | 1 |
solid | |
solve | |
some | |
son | |
song | 1 |
soon | |
sorry | |
sort | |
soul | 1 |
sound | 1 |
south | 1 |
space | 1 |
speak | |
special | 1 |
speech | 1 |
speed | 1 |
spell | 1 |
spend | |
spirit | 1 |
spot | 1 |
spread | |
spring | 1 |
spy | 1 |
square | 1 |
stage | 1 |
stairs | |
stamp | 1 |
stand | 1 |
star | 1 |
start | 1 |
starve | |
state | |
station | 1 |
status | 1 |
stay | |
steal | 1 |
steam | 1 |
steel | 1 |
step | 1 |
stick | 1 |
still | |
stomach | |
stone | 1 |
stop | 1 |
store | 1 |
storm | |
story | 1 |
straight | 1 |
strange | |
stream | |
street | 1 |
stretch | 1 |
strike | 1 |
string | |
strong | 1 |
structure | 1 |
struggle | |
study | |
stupid | |
subject | |
substance | |
substitute | |
succeed | |
such | |
sudden | |
suffer | |
sugar | 1 |
suggest | |
suit | 1 |
summer | 1 |
sun | |
supervise | |
supply | |
support | 1 |
suppose | |
suppress | |
sure | |
surface | |
surprise | 1 |
surround | 1 |
survive | 1 |
suspect | |
suspend | |
swallow | |
swear | |
sweet | 1 |
swim | 1 |
symbol | 1 |
sympathy | 1 |
system | 1 |
table | 1 |
tail | 1 |
take | |
talk | 1 |
tall | |
target | 1 |
task | 1 |
taste | 1 |
tax | |
tea | 1 |
teach | |
team | 1 |
tear | |
tear | |
tell | |
term | 1 |
terrible | |
territory | 1 |
terror | 1 |
test | 1 |
than | |
thank | |
that | |
the | |
theater | 1 |
theirs | |
them | |
then | |
theory | 1 |
there | |
these | |
they | |
thick | |
thin | |
thing | |
think | |
third | 1 |
this | |
those | |
though | |
thought | |
threaten | |
through | 1 |
throw | 1 |
thus | |
tie | 1 |
tight | 1 |
time | 1 |
tin | |
tiny | |
tire | 1 |
title | 1 |
to | |
today | |
together | |
tomorrow | |
tone | 1 |
tongue | |
tonight | |
too | |
tool | 1 |
tooth | |
top | 1 |
total | 1 |
touch | 1 |
toward | |
town | 1 |
track | |
trade | 1 |
tradition | |
traffic | 1 |
train | 1 |
transport | |
travel | 1 |
treason | |
treasure | |
treat | |
treaty | |
tree | 1 |
trial | 1 |
tribe | |
trick | 1 |
trip | 1 |
troop | |
trouble | 1 |
truck | |
true | |
trust | |
try | 1 |
tube | 1 |
turn | 1 |
twice | 1 |
under | 1 |
understand | |
unit | 1 |
universe | |
unless | |
until | |
up | 1 |
upon | |
urge | |
us | |
use | |
valley | |
value | 1 |
vary | |
vegetable | 1 |
vehicle | |
version | 1 |
very | |
veto | |
vicious | |
victim | |
victory | 1 |
view | 1 |
violence | 1 |
visit | |
voice | 1 |
volume | 1 |
vote | |
wage | |
wait | |
walk | |
wall | 1 |
want | |
war | |
warm | |
warn | |
wash | 1 |
waste | |
watch | 1 |
water | |
wave | 1 |
way | |
we | |
weak | |
wealth | |
weapon | 1 |
wear | |
weather | 1 |
week | 1 |
weight | 1 |
welcome | |
well | |
west | 1 |
wet | 1 |
what | |
wheat | |
wheel | 1 |
when | |
where | |
whether | |
which | |
while | |
white | 1 |
who | |
whole | |
why | |
wide | 1 |
wife | |
wild | 1 |
will | |
win | |
wind | 1 |
window | 1 |
wine | 1 |
wing | 1 |
winter | |
wire | 1 |
wise | |
wish | |
with | |
withdraw | |
without | |
woman | |
wonder | |
wood | 1 |
wool | 1 |
word | 1 |
work | 1 |
world | 1 |
worry | |
worse | |
worth | |
wound | |
wreck | |
write | |
wrong | |
yard | 1 |
year | |
yellow | 1 |
yes | 1 |
yesterday | |
yet | |
you | |
young | 1 |
yours |
タイ語の形態素解析やってみた
タイ語の分析をいろいろやりたいと思っていて、その為には形態素解析が必須と思われます。
形態素解析というのは、タイ語の文章があった時に、一つ一つの単語に分解(且つ単語の品詞や基本型なども確認)する解析のことです。
そういう作業を自動でやってくれるプログラムが世の中には公表されています。
ただ、日本語で「タイ語 形態素解析」と調べても、全然あたりがつかなかった。
そこでTwitterで投げかけてみたら、親切な方がPythonのプログラムを教えてくれました。(Py thai NLP というもの。)
見てみたところ、とても良さそうなんだけど、自分はRuby on railsでホームページを作ったりしているので、Rubyのほうが連動性が良いかな、と思い、Rubyのものを探してみました。上の方が教えてくれたおかげで、海外のものでTokenizerと調べればいろいろ入手ができると思い、調べてみたらありました。
Thailang4r というものです。
日本でタイ語の形態素解析をやった記事があまりなかったので、メモしておきます。
(といっても、初歩的なことしか試していないので、大して役にも立ちませんが。)
まずはRubyが使える環境で、上記をインストール。
gem install thailang4r
それで、以下を実施。
# encoding: UTF-8 require 'thailang4r/word_breaker' text="อยากเปลี่ยนวันจันทร์ เป็นวันอาทิตย์" word_breaker = ThaiLang::WordBreaker.new puts word_breaker.break_into_words(text)
大好きなLosoの曲(อยากเปลี่ยนใจเธอ)から歌詞を取ってきました。
実行したら、結果はこんな感じ。
อยาก
เปลี่ยน
วัน
จันทร์
เป็น
วัน
อาทิตย์
まあ、まあ使えそうです。
これからタイ語の歌詞で覚えられる基本語の分析等をやってみたいです。