B美、D菜、F吉、J尼は、J尼家のリビングでオムライスを食べようとしている。J尼が切り出した。
J尼「ニッポンニ、ミステリアスナキャラクター、アリマス」
みんなは興味を持った。
B美「何なの?」
J尼「日本人ナラミンナ描ケルノニ、国際的ニハ全ク無名ナキャラクターデス。性別モ年齢モ性格モ職業モ、ハッキリシマセン。カナリ昔カラアッタヨウデス。キャラクター名ガ無意味ナノデスガ、ナゼソンナ名前ナノカハ、日本人ナラ、誰デモ説明デキルデショウ」
J尼はウィンクした。
J尼「コノキャラクター、何カ、ワカリマスカ?」
※回答を8月17日(日)21:00-21:59に。22:00以降に締切。その他の注意は下の「質問者から」に。
このクイズの回答方法については、過去の問題を参考にしていただければと思います。
答えが分かった方も、コメント欄やtwitter、ブックマーク等でネタばれしないようにお願いします。
またいつもどおり、小説風回答歓迎です。
http://q.hatena.ne.jp/1406471216 ニッポンの嘘魔法
http://q.hatena.ne.jp/1405081515 ニッポンの羊頭狗肉デザート
http://q.hatena.ne.jp/1400504972 ニッポンのイメージダウンフード 222さん原案・lionfan2編
http://q.hatena.ne.jp/1399040599 ニッポンの悲劇的な役職
http://q.hatena.ne.jp/1375089952 ニッポンの伝統のドール
http://q.hatena.ne.jp/1374476099 ニッポンの伝統のグッズ
http://q.hatena.ne.jp/1369538017 ニッポンの伝説のゲーム
http://q.hatena.ne.jp/1357488272 ニッポンの伝説のダンス
http://q.hatena.ne.jp/1346141930 ニッポンの伝統のフード grankoyama様作
http://q.hatena.ne.jp/1346009507 ニッポンの伝統のフード
http://q.hatena.ne.jp/1339511191 ニッポンの伝説のレジャー
http://q.hatena.ne.jp/1334497733 ニッポンの伝説のフード
http://q.hatena.ne.jp/1333979251 ニッポンのゲーム
なお「第二回文学フリマ大阪」2014年9月14日(日)に出展します。
「はてな」の皆様、出展されるのでしたら声を掛けて下さい。遊びに行きます!
ミステリアスなキャラクター、へのへのもへじですね。
日本人ナラミンナ描ケルノニ、国際的ニハ全ク無名ナキャラクターデス。
ひらがなが書ける人ならたぶんみんな描けると思うし、逆にひらがなを使わない文化の人は
へのへのもへじという名前を聞いても、それがビジュアルと直結してるとは気づけないでしょうね。
性別モ年齢モ性格モ職業モ、ハッキリシマセン。
この画像以上の情報がないですもんね…。
カナリ昔カラアッタヨウデス。
Wikipediaによると、江戸時代の中期には流布しているようです
(あと外国語の記事もたくさんできているので、このキャラ海外でもそこそこ知られているみたいですね)。
キャラクター名ガ無意味ナノデスガ、ナゼソンナ名前ナノカハ、日本人ナラ、誰デモ説明デキルデショウ
「へ」「の」「へ」「の」「も」「へ」「じ」の文字を描けばキャラが描けるからです! 前説終わり!
これですよ! ビッグデータですよ!!(違います)
最初に、スクレイピングを実施します。
Rubyという言語を使って、ネットで「へのへのもへじ」を含む歌詞を検索してくるのです!
スクレイピングに関しては、まあぜんぜんわからないのですが、以前この質問で、id:TransFreeBSDさんとid:a-kuma3さんに教えていただきました。
あれから私の能力はまったくアップしてないのですが、今回もがんばるぞ!
~3日後~
ぜぇぜぇ…。なんとかカタチになったぜ…。
が、手作業が多くてダサいので、コードは省略します。
これで重複する曲を除いて16曲の歌詞を手にすることができました。
「もへじ」が含まれてる曲と、
「モヘジ」が含まれてる曲です。
たむらぱん『ハイガール』のように「モヘジ顔」という用例があるので、「へのへのもへじ」では検索しませんでした。
なお「へのへの」だけで検索してみたところ、「へのへのかっぱ」か「へのへのもへじ」のパターンしかないみたいだったので、
今回は上記2つのキーワードで検索したといういきさつです。
次に、これと比較するための「ふつうの曲」を用意しなきゃいけません。
今回は2013年のオリコンシングルランキングから100曲分確保しました。
「へのへのもへじ」が入った曲(16曲)と、2013年に売れた曲(100曲)を比較して、前者の特徴を調べましょう!
その前に、今回は歌詞ごとにテキストファイルがばらばらになっていて、
全部で116のファイルがあるので、これを種類ごとに結合しておきます。
本来であればBashというモノとかを使ってかっこよくやるところなのですが、
私にはこれ以上難しいことは無理なので、GUIでやります♪
複数のテキストファイルを結合する方法 - Jekylle+
こちらのブログを参考に、Automatorを使いました。
めっちゃ便利! すぐできたよ! Appleありがとう!!
これでテキストファイルが2つになりました。両者を比較しましょう。
比較のために、形態素分析をします。
歌詞の言葉を形態素という日本語の最小単位に分割し、それを元にして定量的に分析していきます。
ここからはRという言語に切り替えます。RMeCabという解析器を使います!
ちゃんと使うの初めてだ! 今回もがんばるぞ!
~2日後~
ぜぇぜぇ…。なんとかカタチになりました…。
今回はわりとすっきりできたので、コード晒します。
変なとこあったら教えてくださいみなさん!
setwd("ばすをいれるよ~") library(RMeCab) # 2つの群のテキストを統合しておく # 形態素ごとの登場頻度を求める res1 <- RMeCabFreq("./2013oricon.txt") res2 <- RMeCabFreq("./moheji.txt") # 2つのテキストの総形態素数を求めておく len1 <- length(RMeCabText("./2013oricon.txt")) len2 <- length(RMeCabText("./moheji.txt")) # 頻度を高い順に並べ直す res1o <- res1[order(res1$Freq, decreasing= T ), ] res2o <- res2[order(res2$Freq, decreasing= T ), ] # Freq列を10000語あたりの相対頻度にする res1o$Freq <- res1o$Freq / len1 * 10000 res2o$Freq <- res2o$Freq / len2 * 10000 # 自立語にかぎって上位50語を表示 head(res1o[grep("名詞|^動詞|副詞|形容詞|感動詞|連体詞|形容動詞", res1o$Info1), c(1,4)], 50) head(res2o[grep("名詞|^動詞|副詞|形容詞|感動詞|連体詞|形容動詞", res2o$Info1), c(1,4)], 50)
できました!!
結果は、こうです。
> head(res1o[grep("名詞|^動詞|副詞|形容詞|感動詞|連体詞|形容動詞", res1o$Info1), c(1,4)], 50) | > head(res2o[grep("名詞|^動詞|副詞|形容詞|感動詞|連体詞|形容動詞", res2o$Info1), c(1,4)], 50) |
---|---|
Term Freq | Term Freq |
372 する 87.16988
オリコン | へのへの | |
---|---|---|
する | 87.16988 | 88.18704 |
てる | 53.59334 | 30.76292 |
いる | 34.54510 | 36.91550 |
れる | 31.96229 | 41.01723 |
なる | 29.70233 | 18.45775 |
ある | 23.24530 | 20.50861 |
こうして見てみると「する」「いる」「ある」にはほとんど差がないのに、「てる」「れる」「なる」には大きな差があることがわかります。
これを考えると、オリコン曲のほうがへのへの曲に比べて、主体性があって自立している感じがある気がします。
「てる」はオリコン曲のほうがずっとスコアが大きかった形態素です。
「~している」という形で動詞の後ろにつくとき、なにかの動作を客観的に描写している感じが出ると思います。
こういう表現が多いオリコン曲は、冷静で大人な感じが出るし、それが少ないへのへの曲は少し舌足らずな印象を受けます。
逆に「れる」はへのへの曲によく見られ、オリコン曲には多くありませんでした。
「れる」は受け身だったり自発だったりに使われる表現。
基本的に、自分の意志ではどうにもならないものに使うんですよね。
そういうものが多く出てくるへのへの曲は、オリコン曲よりも少し子供っぽい感じになりそうですね。
だから補助動詞の頻度を考えると、「へのへのもへじ」は歌詞の世界で、
どちらかというと子供っぽい曲に使われる印象があるっぽいことがわかりました。
でもこれ、わざわざ調べなくてもだいたい察しがつきますね…(死)
さて、ここまで、個別の歌詞の内容についてはまったく立ち入らずに来ました。
が、統計だけでもここまで妄想できるみたいってことがわかりました。
歌詞って繰り返しが多いので、単純に登場頻度だけでカウントする今回の調べ方はおかしいはずなのですが、
お遊びってことでお許しくださいませ。
また、オムライスのことが出てくる歌詞はなかったもようです。
今回はこの企画に便乗するかたちでめっちゃお勉強しました。
よいきっかけをどうもありがとうございました!
夏も本番で、暑い日が続きます。
こう暑いと、コンロの前で火を使うのも、前世のカルマに起因した、何かの修行なのではないかと疑いすら覚えます。
とはいえ、ご飯はきちんと作りたい、と思うあなたに、レンジだけで作れるオムライスのレシピを、ご紹介します。
id:a-kuma3様
読み終えて、最後の写真で声を出して笑ってしまいました。こりゃベストアンサーは確定! 他の人、残念でした今回は運が悪かったねぇ・・・と、id:hacosato様の回答を読むまでは思ってました。id:a-kuma3様、すみません、これは仕方ないです。ある意味、id:a-kuma3様のアドバイスがあったればこそid:hacosato様も分析ができたわけなので、今回のid:hacosato様のベストアンサーの何割かは、自分の手柄とお考えになってOKです。お詫びの印に、ポイントを少し多めに配分いたします。
id:hacosato さんのベストアンサーは、納得です。
(得意の)歌詞に絡めて、スクレイピングとは、想像外でした。
いや、目が「の」になってないのが駄目だったんだな、きっと。
さすがに、オムライスを、二つも三つも作る気にならなかった弱気が駄目だったんだな、と :-)
ミステリアスなキャラクター、へのへのもへじですね。
日本人ナラミンナ描ケルノニ、国際的ニハ全ク無名ナキャラクターデス。
ひらがなが書ける人ならたぶんみんな描けると思うし、逆にひらがなを使わない文化の人は
へのへのもへじという名前を聞いても、それがビジュアルと直結してるとは気づけないでしょうね。
性別モ年齢モ性格モ職業モ、ハッキリシマセン。
この画像以上の情報がないですもんね…。
カナリ昔カラアッタヨウデス。
Wikipediaによると、江戸時代の中期には流布しているようです
(あと外国語の記事もたくさんできているので、このキャラ海外でもそこそこ知られているみたいですね)。
キャラクター名ガ無意味ナノデスガ、ナゼソンナ名前ナノカハ、日本人ナラ、誰デモ説明デキルデショウ
「へ」「の」「へ」「の」「も」「へ」「じ」の文字を描けばキャラが描けるからです! 前説終わり!
これですよ! ビッグデータですよ!!(違います)
最初に、スクレイピングを実施します。
Rubyという言語を使って、ネットで「へのへのもへじ」を含む歌詞を検索してくるのです!
スクレイピングに関しては、まあぜんぜんわからないのですが、以前この質問で、id:TransFreeBSDさんとid:a-kuma3さんに教えていただきました。
あれから私の能力はまったくアップしてないのですが、今回もがんばるぞ!
~3日後~
ぜぇぜぇ…。なんとかカタチになったぜ…。
が、手作業が多くてダサいので、コードは省略します。
これで重複する曲を除いて16曲の歌詞を手にすることができました。
「もへじ」が含まれてる曲と、
「モヘジ」が含まれてる曲です。
たむらぱん『ハイガール』のように「モヘジ顔」という用例があるので、「へのへのもへじ」では検索しませんでした。
なお「へのへの」だけで検索してみたところ、「へのへのかっぱ」か「へのへのもへじ」のパターンしかないみたいだったので、
今回は上記2つのキーワードで検索したといういきさつです。
次に、これと比較するための「ふつうの曲」を用意しなきゃいけません。
今回は2013年のオリコンシングルランキングから100曲分確保しました。
「へのへのもへじ」が入った曲(16曲)と、2013年に売れた曲(100曲)を比較して、前者の特徴を調べましょう!
その前に、今回は歌詞ごとにテキストファイルがばらばらになっていて、
全部で116のファイルがあるので、これを種類ごとに結合しておきます。
本来であればBashというモノとかを使ってかっこよくやるところなのですが、
私にはこれ以上難しいことは無理なので、GUIでやります♪
複数のテキストファイルを結合する方法 - Jekylle+
こちらのブログを参考に、Automatorを使いました。
めっちゃ便利! すぐできたよ! Appleありがとう!!
これでテキストファイルが2つになりました。両者を比較しましょう。
比較のために、形態素分析をします。
歌詞の言葉を形態素という日本語の最小単位に分割し、それを元にして定量的に分析していきます。
ここからはRという言語に切り替えます。RMeCabという解析器を使います!
ちゃんと使うの初めてだ! 今回もがんばるぞ!
~2日後~
ぜぇぜぇ…。なんとかカタチになりました…。
今回はわりとすっきりできたので、コード晒します。
変なとこあったら教えてくださいみなさん!
setwd("ばすをいれるよ~") library(RMeCab) # 2つの群のテキストを統合しておく # 形態素ごとの登場頻度を求める res1 <- RMeCabFreq("./2013oricon.txt") res2 <- RMeCabFreq("./moheji.txt") # 2つのテキストの総形態素数を求めておく len1 <- length(RMeCabText("./2013oricon.txt")) len2 <- length(RMeCabText("./moheji.txt")) # 頻度を高い順に並べ直す res1o <- res1[order(res1$Freq, decreasing= T ), ] res2o <- res2[order(res2$Freq, decreasing= T ), ] # Freq列を10000語あたりの相対頻度にする res1o$Freq <- res1o$Freq / len1 * 10000 res2o$Freq <- res2o$Freq / len2 * 10000 # 自立語にかぎって上位50語を表示 head(res1o[grep("名詞|^動詞|副詞|形容詞|感動詞|連体詞|形容動詞", res1o$Info1), c(1,4)], 50) head(res2o[grep("名詞|^動詞|副詞|形容詞|感動詞|連体詞|形容動詞", res2o$Info1), c(1,4)], 50)
できました!!
結果は、こうです。
> head(res1o[grep("名詞|^動詞|副詞|形容詞|感動詞|連体詞|形容動詞", res1o$Info1), c(1,4)], 50) | > head(res2o[grep("名詞|^動詞|副詞|形容詞|感動詞|連体詞|形容動詞", res2o$Info1), c(1,4)], 50) |
---|---|
Term Freq | Term Freq |
372 する 87.16988
オリコン | へのへの | |
---|---|---|
する | 87.16988 | 88.18704 |
てる | 53.59334 | 30.76292 |
いる | 34.54510 | 36.91550 |
れる | 31.96229 | 41.01723 |
なる | 29.70233 | 18.45775 |
ある | 23.24530 | 20.50861 |
こうして見てみると「する」「いる」「ある」にはほとんど差がないのに、「てる」「れる」「なる」には大きな差があることがわかります。
これを考えると、オリコン曲のほうがへのへの曲に比べて、主体性があって自立している感じがある気がします。
「てる」はオリコン曲のほうがずっとスコアが大きかった形態素です。
「~している」という形で動詞の後ろにつくとき、なにかの動作を客観的に描写している感じが出ると思います。
こういう表現が多いオリコン曲は、冷静で大人な感じが出るし、それが少ないへのへの曲は少し舌足らずな印象を受けます。
逆に「れる」はへのへの曲によく見られ、オリコン曲には多くありませんでした。
「れる」は受け身だったり自発だったりに使われる表現。
基本的に、自分の意志ではどうにもならないものに使うんですよね。
そういうものが多く出てくるへのへの曲は、オリコン曲よりも少し子供っぽい感じになりそうですね。
だから補助動詞の頻度を考えると、「へのへのもへじ」は歌詞の世界で、
どちらかというと子供っぽい曲に使われる印象があるっぽいことがわかりました。
でもこれ、わざわざ調べなくてもだいたい察しがつきますね…(死)
さて、ここまで、個別の歌詞の内容についてはまったく立ち入らずに来ました。
が、統計だけでもここまで妄想できるみたいってことがわかりました。
歌詞って繰り返しが多いので、単純に登場頻度だけでカウントする今回の調べ方はおかしいはずなのですが、
お遊びってことでお許しくださいませ。
また、オムライスのことが出てくる歌詞はなかったもようです。
今回はこの企画に便乗するかたちでめっちゃお勉強しました。
よいきっかけをどうもありがとうございました!
id:hacosato様、お疲れ様でした! ばっちり正解+歌詞の定量分析と、実にお見事でした。プログラムも、すっきりして無駄がないと思います。Rは自分も「はじめてのS‐PLUS/R言語プログラミング」という入門書を書いたことがあり、思い出深い言語です!
自分はクイズの教育効果について研究しています。よく「クイズと教育とどんな関係があるの?」と聞かれるので、「一つのことを追求すると、自然に他の事にも興味を持って学ぶようになる」と答えているのですが、id:hacosato様は最高の例でした。今後、学会発表などで引き合いに出させていただこうと思います。よろしくお願いいたします。
ありがとうございました。
id:lionfan2さん、Rの本を書かれていたのですね!
はてな界隈スゴい人多すぎです!
本当なら、補助動詞のところでt検定(ですよね?)を使うべきだったし、
6種類の比較は棒グラフにしたいところでしたが、
(主にRを使いこなす)力が及ばずそこまで至りませんでした…。
統計もRubyもRも、すべて今年になってから勉強を始めたので
どれもまだ道半ばですが、こうして中間報告をできてよかったです。
id:a-kuma3さん! ここまでできるようになりましたありがとうございます!
コメの後半はちょっとよくわからなかったのですが、
このURLに載っている範囲内のことでしたらご紹介くださいませ。
「その濁点は何なのであろうか。」
ふと、茂平は思った。目の前の机に書かれた図形を見てである。
「耳なのだろうか。耳の穴であれば一個であるな。このように二個あったら怖い。」
チョークで書かれた図形は、こすれば消えてしまう。茂平は左手で、叩くように消した。
「おや?もへじ君帰るの?」
茂平の両肩に手を掛け、ニヤリと笑うのは、後ろの席に陣取っている隆。その後ろには、龍二も、のそっと立っている。
「じゃあ、見送ってあげるよ。ほら、かばんをお持ちしました」
隆が差し出した茂平のカバンは、どこをどうやったのか、裏返っていた。中に入っていた教科書も、真ん中のページが外側になってしまっている。
「じゃあねぇ」
といいながら、龍二は茂平を教室から廊下へと押し出した。それになされるまま廊下に向かった茂平は、差し出された隆の足に引っかかる。そのまま茂平は、廊下に倒れこんだ。
「足元にも、気を付けてお帰りください」
笑いながら教室の奥へ消えていく隆と龍二。それを気にする様子もなく、茂平は立ち上がった。茂平は両手を打ち合わせて埃を落とすと、そのまま廊下を歩きだした。
ある朝、茂平が登校すると、教室の黒板が「へのへのもへじ」で埋まっていた。
「この努力って、なにかほかのことに使えないのだろうか」
と茂平は思った。そして、黒板消しで右隅のへのへのもへじを消し始めた。
「おやぁ、ご自分をお消しになるんですかぁ?」
大きな声でこう言いながら、隆が入ってきた。そのあとに龍二も続く。
「書き換えるだけだよ。せっかくだから」
茂平はこう言い、へのへのもへじを書き換えた。
「へのへのもへの」
顔の左下を覆っていた「じ」を消し、全体を大きな「の」でくるむように描いた。
「これが、へのへのもへじの原型といわれる「へのへのもへの」だ」
龍二がそれを見て言う。
「やっぱりへのへのもへですか。平野茂平さん、いやヘイノヘイノモヘイさん」
「へのへのもへい、へのへのもへい」
隆が囃し立てる。
それを半ば無視して、茂平はもう一つのへのへのもへじの口と鼻と濁点を消した。
そこを、書き換えると、次のへのへのもへじも書き換える。
それは、へのへのたかしとへのへのりゅうじだった。
「お、お前なぁ」
と掴みかかろうとする龍二をかわし、茂平はもう一つのへのへのもへじを書き換える。
それは、へのへのもへじではあった。が、猫でもあった。
「かわいい。これ、へのへのもへじなの?」
クラス委員の涼子が、教室のうしろから駆け寄ってきた。
「ほんとだ、へのへのもへじって書いてある。かわいい」
「ええ、これがへのへのもへじなの?猫かわいい」
クラスの女子が駆け寄ってきて、茂平と隆の間に壁ができた。
涼子が茂平を見て言う。
「ほかにも知ってるの?」
茂平は軽く頷き、黒板の半分を消してしまう。
チョークを持ち直し、茂平は呟きながら黒板を埋めていく。
「つるさんはまるまるむし」
「ねえ、これ知ってる?棒が一本あったとさ・・・
いじめが無くなるのは、ほんのちょっとのきっかけなのだ。と、冷静に頭の中に刻み込む、茂平だった。
id:takejin様
いつも小説風の面白い回答、ありがとうございます。お疲れ様です! へのへのもへじの画像、準備が大変だったと思います。今回は、id:takejin様をはじめ3名の回答を読んで、軍曹のように「この中からベストアンサーを選ばなければならない俺が可哀想だ!」と呻きながら、コメント文を書いておりました。
画像はそれほど難しくはなかったんです。
書いてjから、公開しないように秘匿するので悩みましたね。
(フォトライフで、フォルダを非公開にするんですね。勉強になりました)
id:hacosato様、お疲れ様でした! ばっちり正解+歌詞の定量分析と、実にお見事でした。プログラムも、すっきりして無駄がないと思います。Rは自分も「はじめてのS‐PLUS/R言語プログラミング」という入門書を書いたことがあり、思い出深い言語です!
2014/08/17 22:12:28自分はクイズの教育効果について研究しています。よく「クイズと教育とどんな関係があるの?」と聞かれるので、「一つのことを追求すると、自然に他の事にも興味を持って学ぶようになる」と答えているのですが、id:hacosato様は最高の例でした。今後、学会発表などで引き合いに出させていただこうと思います。よろしくお願いいたします。
ありがとうございました。
2014/08/18 12:06:05id:lionfan2さん、Rの本を書かれていたのですね!
はてな界隈スゴい人多すぎです!
本当なら、補助動詞のところでt検定(ですよね?)を使うべきだったし、
6種類の比較は棒グラフにしたいところでしたが、
(主にRを使いこなす)力が及ばずそこまで至りませんでした…。
統計もRubyもRも、すべて今年になってから勉強を始めたので
どれもまだ道半ばですが、こうして中間報告をできてよかったです。
id:a-kuma3さん! ここまでできるようになりましたありがとうございます!
コメの後半はちょっとよくわからなかったのですが、
このURLに載っている範囲内のことでしたらご紹介くださいませ。