自然言語処理100本ノック30~ - Pythonと数学と音楽とetcの落書き帳

こんにちは。
身近な人が、就活に失敗して、精神不安定になり、消費者金融からお金を借りて仮想通貨の詐欺に投資し、豪遊してしまっていて、親が六ヶ月たったあと発見して自発的に返済する。ということがおきましていろいろ考えます。

精神不安定な人につけこむ奴恐ろしい、というのと、そういう時にHelp出せないと危ないなと。

わからないことやできないことを素直に言える相手って大切です。
もはや僕は知らない人にでもそういう話をできるような、真っ裸になれるような人になりたいなと思ったりもしたりです。

さてそれとは別に、昨日、仲の良い先輩の京大M進祝をして、モチベーションが上がっているのと、
もう少し早く細かいところに入りたいので、言語処理100本ノックをしていきたいと思います。
1時間30分タイムアタックということで、いつもどおり総なめしていきます。

Introduction
概要とはまったところとか
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
おわりに
参考

But first, let me take a selfie.

The Chainsmokers - #Selfie (Club Mix) (Out Now)

Introduction

自然言語処理100本ノック
言語処理100本ノック 2015
30～はじめていきます。
今日はMeCab使った形態素解析がMainかな！

概要とはまったところとか

30

・概要
neko.txtを形態素解析するよ！！
一文毎に辞書型のリストで返すものを作ります。
MeCabは業務で使って、標準辞書を
GitHub - neologd/mecab-ipadic-neologd: Neologism dictionary based on the language resources on the Web for mecab-ipadic
に設定してあるので僕はこれでやります！！
参考サイトでは、ジェネレータを
yieldで作ってなにかしてる。調べてみよう

・よくわからん
Pythonのイテレータとジェネレータ - Qiita
ジェネレータ…イテレータの一種で、要素を取り出すたびに処理を行い要素を生成する。
イテレータは反復処理で、for文？
ジェネレータ関数というものが存在して、return の変わりにyieldを使っているようだ。
リストとして用意するより、ジェネレータとして用意することによって、計算コストを節約するために使ったりするらしい

・参考
Pythonのイテレータとジェネレータ - Qiita
素人の言語処理100本ノック:31 - Qiita