Pythonと数学と音楽とetcの落書き帳

かなりテキトーに、断片的に離散的にプログラミングや、音楽やいろいろなことを書いていく。洋楽のレビューのついでにPythonその他のブログや本のノート、備忘録を書いていきます。

やるかやらんか

あーまたざっくりした哲学的な思考が多くなっちゃったよ。

自己啓発的内容、哲学的内容って、言及する範囲がとてつもなく文系的で、飛躍を含む内容なのだと思います。

でも飛躍っていうのは、当たり前の具体的なところから飛躍しないと、飛躍から飛躍してもとんでも論理になっちゃうので、
当たり前の具体的なところ、つまりロジカルな部分をしっかりと頭に抑えることが、飛躍的論理の質を上げる大事なポイントだと思うんです。

だから、努力とか、姿勢の話ばっかりじゃなくて、確かな真実、原理、現象をしっかり考えること大事なんだと思います。
具体的に、定量的に、努力を積み重ねた人が勝つと僕は考えています。
僕は大学生のエネルギーと時間をPythonと深層学習と数学に捧げます。

コツコツとした努力は無駄『時間をかけずに成功する人 コツコツやっても伸びない人 SMARTCUTS』 - HIU公式書評ブログ


さて、今日もPython中心にプログラミングの勉強とお仕事!

xml Parser でハマってる
Beautiful soup! lxml!

あるあるだけど春休みにダラダラしてしまった

これは一昨日寮に引きこもって自己満足にふけり、ゲームの動画、オリンピックの動画を布団に入って、かつをのたたきをかじるだけの豚さんになった僕が、
そういう生活をしてしまう自分が嫌いで、おかげで彼女との時間も楽しめなかった反省の記録である。

ずっとワンパンマン読んでた、(新旧両方)
[第1話] ワンパンマン - 原作/ONE/漫画/村田雄介 | となりのヤングジャンプ
ワンパンマン
古い方はともかく、新しい方は絵の上手さと、人間の欲や、強さをテーマにしたダークファンタジーっぽい設定の上で、単純明快で絶対的な強さを持つ主人公が活躍する漫画である。

あと、ゲーム実況動画見てた。
【SPORE】本格的に進化を見よう‐文明編‐【VOICEROID実況】 by 16.7 km/s ゲーム/動画 - ニコニコ動画

ドラゴンクエストライバルズ、ドラゴンクエスト11の感動シーン見てた。
超速攻Tier1『アグロゼシカ』攻略班トシのゲーム実況【ドラクエライバルズ/DQR】 - YouTube
DQ11 ドラゴンクエストXI - ベロニカの最期 - YouTube

ときの人々(?)となった平昌オリンピック女子カーリング見てた。
【NHK・速報】カーリング女子、初の銅メダル!!<ピョンチャン> - YouTube
本当におめでとうございます!!
僕のタイプは、藤澤五月さんでした。
他のメンバーが半袖で元気な女の子!って感じだけど彼女はウィンドブレーカーでもこもこしてて、雪国の女の子っぽくて目立ってますね。デコ出しもとてもかわいかった!


スポーツをやってる人は本当に輝いてるなって思うんですよね。
もちろんスポーツ界は現役として続けられる選手寿命が短いとかは明らかなので、アスリート自身も葛藤する人は多いと思うんですけど、
あれらって、資本主義社会においては、マネタイズされるタレントとしてがんばるっていうか、アイドルみたいな感じで、
スポーツのファンがいて、大会を開催する国があって、初めてスポーツで食っていけるというか、
まあ起業家とか、サラリーマンとか事業で稼ぐ人々より、自分の生活の社会に対する依存度が高いですよね。
オリンピックに出られずに花開かない人も多そうだし。

まあ何を言いたいかというと、スポーツはすごく人間らしい、想像とか夢とか小説的な世界ですよね。
スポーツって本来は娯楽だし、直接的に社会に関わることはできず上記のような媒介者がマストになります。
そういうもので、競争を勝ち抜くための努力を続けるためには、やはり人間の想像力を使って自分のモチベーション、meaningをcreateしていかないと続かないと思います。

日々の辛い練習を、ある意味正当化するプロだと思うんです。
そうやって努力する姿はそれ自体が素晴らしいし、ただ何も考えずものごとに取り組む人々の何倍も成長できると思う。
スポーツを辞めてから、スポーツの美しさ、尊さ、強さに気づきました。

僕はプロアスリート並に、そういう想像力を使って自分Madnessを育てて、
アスリートのように節制をすることで社会においてBIGな人になりたい。

制約や練習から来るフラストレーションや辛さに逃げずに向き合い、安易な方法で昇華させずに、目的に対して超ダッシュしたい。

そのためにはやはり、ストイックさ、禁欲も大事なので、娯楽はほどほどにしたいものです。


長期休み、僕の生活にはほとんど縛りが存在しないのですが、

Pitbull - Feel This Moment ft. Christina Aguilera
(いやー最近の音楽の趣味はもっぱらHIPHOPになってしまいました。)
動画とか漫画とかマスとか()安易な自己満足に浸るのをなるべく少なくしたい。

喜びや達成感は、目標を成し遂げないと得られない。
磨くのを辞めたら腐る。
磨くモチベーションは、無から発生するのではなく、弱い自分を認識して逃げずに向き合うことによって生まれると思います。

現実逃避はやーめた!

タイムマネジメントじゃなくてストレスマネジメント、す

さてこの時期の札幌は、もう14時ごろになると日が傾きかけてきます。
今日も未来をすっと読めるようになるために、(なると僕は科学をしんじている)
ロジックの勉強をします。
午後に、読書と、静かな勉強、ボールペンを使った勉強がしたくなり、マクドナルドのハンバーガーが久々に食べたくなったので、マクドナルドで数論と確率論の勉強を

その前に落合陽一先生のお話をIntroductionとして

落合陽一先生はほとんど寝ずに新時代の働き方としてワークアズライフを掲げて、ストレスかかる仕事とかからない仕事を組み合わせて毎日忙しくしているそうです。

寝ずに頑張るのはとても短絡的な最適化で、体を大事にして、もっと長く頑張る方が人生のサイズ感のようなものは大きくなる気がするんですが、
落合先生は落合先生の目的の基、既に日本の最先端にいながら、トップスピードで突き進んでいます。
そういう理屈を超えた英雄感に僕は惹かれるのだと思うし、そのために睡眠を削るという儀式なのかもしれません。

まあ僕は睡眠は自然量(目覚ましなしで毎日つらくなく生活できる量)でいこうと思いますが、とりあえず落合先生のストレスマネジメントの考え方をパクっていこうと思います。

落合先生が取り組むことがいくつかのジャンルに分類できるように、
僕の日常のタスク達を分類すると、
(僕の生活で、少なからず僕の人生を豊かにする時間であり、必須なもの、もしくは空いてる時間を投資したいと自ら思うもののみ)

ストレス高め

授業・レポート・テスト(ほぼ数学)春休みはないよ!
バイト(PythonDeep Learning応用した開発)

バイトや授業にレバレッジをかけるための勉強(Deep Learning, NLP, Probability, Statistics, Processing Language)
トレーニング
SNSTwitter、ブログ書く、読む)、自己啓発寄りの本

生命活動(食事、風呂、睡眠、se...etc)
洋楽を歌詞の意味とかに気を巡らせながら聴いて歌う
人間関係(彼女、バイト先の方々)
YoutubeMinecraft wiki

ストレス低め

てところですかね。全くMECEじゃないですが。
どれもやりはじめはストレスが低めで、連続時間が蓄積するほどストレスは高くなりますね。
さて最近は流氷見てマクロでVisualな思考をしていたのでPCや本に向き合うための相対的なストレスが下がっている気がします。

そんでもってテクニカルな勉強ばかりしてきたので、理論の勉強や、そこから派生した詩的な表現などの自然言語、原理的な勉強を少しはさもうと思います。

今日聴く音楽達


Roses The Chainsmokers Ft Rozes || Lyrics

Meghan Trainor - Like I'm Gonna Lose You ft. John Legend
やっぱりChainsmorkersいいな、
ハウスミュージックていうんですかね。
Chainsmorkersはとても暖かみのある音楽が多いので、EDMというジャンルに入るのかよくわからなかったので、今日やっとググったのですが
多分入るようですねWikipediaによると(適当
エレクトロニック・ダンス・ミュージック - Wikipedia
シンセサイザーとか電子音使ってればOK


あと、そんな感じじゃない「歌唱力」って感じのも一曲ヘビロテで、
Charie puth とMarvin gayeでコラボしてて知った
Meghan trainerさんは、あんまり僕の周りの人で聴いてる人はいないのでよくわからないんですが、曲調とか、歌い方は好みなので関連曲聴いていこうと思います。

Meghan Trainor & Charlie Puth - Marvin Gaye AMAs 2015


ということでインターネットを遮断して一回マクドナルドではじめての数論と、確率論の入門書(といえばかっこつくけどただの数学ガール乱択アルゴリズム編ね)
を読んで引きこもります。
あと、大栗さんの数学の言葉で、、、

はじめての数論 原著第3版 発見と証明の大航海‐ピタゴラスの定理から楕円曲線まで

はじめての数論 原著第3版 発見と証明の大航海‐ピタゴラスの定理から楕円曲線まで

数学ガール/乱択アルゴリズム (数学ガールシリーズ 4)

数学ガール/乱択アルゴリズム (数学ガールシリーズ 4)

を読もうと思いましたがカーリングをぐだぐだしてしまったので一度流します

Jupyter notebookを載せようと思ったけど辞めた。今してる集中のための環境構築を書いてみる。

Jupyter notebookの載せ方調べようと思ってましたけど、やめました。
なんかどうせ大したコード書かないし、公開はGithubでええやんて。
このブログは雑記じゃ

朝がやはり好きで
朝の人間の頭はさながら生まれたての子供のように真っ白で、音楽を聴くと良い音やフレーズに気づき、多少嫌なタスクに対してもすんなりはじめられたりします。

今日は朝からバイトのタスクをやろうと思うので、詳細はここには書けませんが()
音楽を聞きながら、オイルコーヒー飲みながら自然言語処理をしていきます。

要素の追加と連結(appendメソッド, extendメソッド) - リスト - Python入門
Pandasでデータ集計をする際に最低限覚えておきたいメソッド - Qiita

Pandas便利ですねー
DataFrameの扱いやすさ半端ない

そういえば先日R言語をかじった時にPandasと同じRのデータフレームに出会ったんですが、
Indexが1から始まってて、ヨーロッパ生まれじゃねえなこいつって思ったら案の定ニュージーランドでした
R言語 - Wikipedia
Rは開発者のイニシャルなんですね。

Pandasが便利すぎてRを勉強する必要ないんじゃないかと思ったんですが、Rの乱数の教科書買ってしまってるのでまあのちのちに取り組もうかな。

デュアルディスプレイ、踊れる広さ、1人の空間、体にいい飲み物、もう最高ですよね。
唐突ですが最近の僕の集中する際に整えている環境を羅列していきたいと思います。

ほぼ必ず揃えるもの

独り言を言って歌える環境

→聴覚からも自分の発言で情報を入れたりしたいです。そして、体を伸ばしたり、人に気を使わずにできるとよいです。
→将来的にはひと目を気にせず独り言言えたら良いな(もちろんTPO)

視界の整理整頓(断捨離)

→ポモドーロ・テクニック、選択の科学という本の影響(選択の科学ほとんどよんでねー)で、まあ何かやってるときに、ちょっとでも情報が頭に入ったり、余計な選択肢があると、集中によくないよねという意識があるから

(PCを使う時)デュアルディスプレイ、上下で、下にBlog草稿、エディタ、上にブラウザ、参考書、Ever note
(本を読む時)白紙たくさん、ホチキス、ボールペン(できればJetstream)

→落合先生も、数学科の生成達も手を動かせというので、
Ever noteや白紙に、コピペや、断片的な知識をとにかく書く!とにかく頭の新陳代謝を上げるイメージ

あるといいもの

飲み物

→基本カフェインでドーピングしますが、最近とりすぎてます。

緊張感

→自由な環境に少しの緊張感があると最高です。

歌詞なし音楽(EDM、ゲーム・アニメのSoundtracks)

→さながらゲームの主人公のような英雄感に浸れます。

ていう感じです。
僕の精神の健康には、こういう、体にいい、集中して頭を使う必要が必須なようで、
営業マン時代にはこういう時間作れなくてもう全然だめだめ男マインドでした

僕の儀式のようなもので、やっぱこういうその人それぞれのそういう時間が大切なんですね()



P.S
僕は小さい頃から運動の習慣があり、女の子が好きで体をかっこよくしたいのでトレーニングをしています。
幸運なことに僕の札幌での居所とトレーニング設備のある場所がとても近いので、危ない香りしかしませんが家で煮物を火にかけながら時間を決めてトレーニングしてます。
おかげでだらだらトレーニングすることはありません(だらだらトレーニング大嫌い!)

トレーニング好き、というと、そうした人々がプロテインを信仰するあまり僕もプロテインを飲んでるのかと聞かれるのですが、
僕はプロテイン飲んでません。

僕は高校の頃野球部でしたが、実質トレーニング部だったので生理化学、栄養学を知らぬ間に独学して、(自慢ですが)高校の駿台模試で生物の偏差値86を取ったことがあるくらい
栄養マニアですし、
今も一昔前の

シリコンバレー式 自分を変える最強の食事

シリコンバレー式 自分を変える最強の食事

こんな本を信仰していて、未だにオイルコーヒー飲んでるんですがプロテインは飲んでません。
(オイルコーヒーにはちみつ入れたら糖質的にはアウトだけど、オーガニックレッドブルだよねって最近思います。

何故でしょう。わかりません。

プロテイン有りきで体作るのが嫌だから!と理由をつけますが、そのうち買うかもしれません。

今の世の中でプログラミングを勉強することについて。

またまた僕の大好きな勉強ノウハウについて断片的なことを書いていくのですが

堀江さんのブログを読んでいても、周りの友達の雰囲気からしても、

プログラミング学習のハードルが下がり、そこに対して取り組もうとする意思を持つ人達が増加してきていることを感じました。

 

Twitterで、Progateで稼げるようになるまで、みたいなアカウントとか、堀江さんに対して言語何使えますか-何が流行りますかー的な質問も増えてきたし、

Progateがアプリでクイズ形式で勉強できるようになったし。

僕のバイト先も知り合いもDeepLearningの法人向け勉強会でガッポガッポみたいだし(あぶねえ情報だなあ)

なんやもうプログラミングを勉強するのってアタリマエに近くなってきている時代だと思う。

 

そこで僕のプログラミングの勉強スタンスの整理だが、

バイトを通じて実社会でニーズのあるロジックを感じ取って、出来る限りネットに落っこちてる先人達の断片を使って少ないコストでReconstructできるようになる。

ことをダイイチ目標にしようと思う。

 

もちろん一から原理を理解することは大切なのだが、それだとOutputとの距離が遠すぎて僕のモチベーションは続かないし、一つ一つベンチマークとなる報酬(お金)がないと厳しいので、

使える、役立つ、おもしろい、という非ロジカルな、非ファンダメンタルな、Usefulで、Socialistな感じで勉強していく。

 

プログラミング教育がビジネスになって民間企業の参入がどんどん盛んになる時代では、プログラミングがただできる辞書的脳を作ってもあんまり活躍できない気がしたので、

僕のプログラミングの勉強の狙いはロジックの理解、

それで、そのロジックを使ってどんな社会の課題が解決できるかなっていうのを仮説立てて自分で検証するところを担いたい。

 

テクニカルの細部まで頭に入ってないから、自分で作るには時間がかかるけど、社会が何を求めてるか読める人、つまり、文系in理系的な人になろうと思う。

文系の人の方が収入高いっていうしね、流れ読めないとどんなテクニック持ってたって現代資本主義社会での強者にはなれないんじゃないかなー

僕がプログラミングを学ぶモチベーション

・専門中の数学(基礎学問)と現代社会の課題の橋渡し

・現代イノベーションの基盤はコンピュータ(ex.仮想通貨、ブロックチェーン、Deeplearning)という仮定で、未来を予測できる人になる

→未来予測できたら、Bitcoinの例とか見てて分かるけど、お金も儲けられるよね!

 

上記をまとめると、専門でどうせ基本原理をやらざるを得ないし、堀江さんみたいにドロップアウトしてスクラッパーから一発逆転するより、勇気がない人たちの手法である、一般ルート(小中高大を経て就職、就職はしないかも)で、未来を予測し、そこにベットできる勇気と脳を持った人材になる。

自然言語処理100本ノック!!(10~19)をただ動かして感想を述べる。

最近週刊スピリッツで連載中のジャガーンという漫画にハマっています。

ジャガーン 1巻 :無料・試し読みも!コミック 漫画(まんが)・電子書籍のコミックシーモア

 

東京グールや、寄生獣と同じダークファンタジーに入る(と思われる)作品で、グロ、エロ、ラブロマンス、正義や芸術といった哲学主張が詰まっている作品で、やっぱ僕はこういうのが好きなんだなと

グロ描写で人間の生と死を身近に感じ、エロ描写で人間の本能とか、欲とかを認識して、ラブロマンスや、哲学的描写で人間の正義とかきれいごととかそういうものに浸る快楽とかも認識できる良い作品だと思います。

 

僕はやっぱり男の子でかっこいいもの好きなのと、動物としての人間らしさが描かれいるものがとても好きです。

 

そう、人間にはやはりエロを求めるところや、過度に自分が関わる汚いものから目をそむけ、きれいごとにいきるところとか、そういうとこから目をそむけず考えていくのって大事なんだなって(もう言葉がぐちゃぐちゃですが、)

 

ドラゴン桜の国語の芥川先生も言っていましたが、人間は毒を求めるし、それが人間なのだって感じですね。

 

僕が営業といか部活とかやってた経験上、自分の毒々しい部分、人間らしい性欲とか弱さを人に見せない人ほど、何かちょっと信用できない、壊れやすい人な気もします。(僕自身もきれいきれいな言葉、哲学とかばかりの生き方に長い間身を焦がした人間として)

 

人間って面白いですよね。機械学習の勉強はそういったことと関わりが深いところもあり、勉強するモチベーションの一つにもなります。

 

学問の最終ゴールは人間の再現って友達が言ってたな、とか思い出しつつ、

今日は人間の言語の解析の勉強をしていきます。

自然言語処理の勉強をしていきまし。

旅行でできなかったトレーニングを午後にあるミーティングの前にしたいので、時間を2時間半と決めて、やっていきます。

 

 

今日聞く音楽

今日も例のごとく、The Chain Smorkersを聴いていきます。

Chain Smorkersいいですね。なんか他のEDM(僕がEDMと認識してるのは、The Chemical Brothersとか、Avicciとか、Zeddとか、)と違ってちょっとエモいというか、(落合先生がエモいってよくTwitterで使うのでなんとなくエモいって言ったけどよく意味がわからないまま使う)

上品な感じがとても良いです。

今日聞くのは、僕が思うThe Chain Smorkersのエモい曲


The Chainsmokers - Honest (Audio)


The Chainsmokers – Paris (Lyrics)


The Chainsmokers - Young (Audio)

このジャケット?グラフィックもどことなく温かみというか、落合先生が表現していたぼんやりとくっきりという日本人的感性に近いというかそんな感じがしますね。

今日の勉強主題

今日もバイト先は一人でガリガリ勉強できそうな朝なので、

www.cl.ecei.tohoku.ac.jp

三年前のものですが、こちらをガリガリとやっていきたいと思います。

環境としては

Python 3.6.3, Jupyter notebook, Windows10 Bash on Ubuntu

で0番から順に解いていきます。

 

 Markdown記法にしてコピペすればipynbファイル貼れるみたいなんですが、書いてから気づいて記法の変更ができないので、次のポストでJupyter notebookをはてなブログに載せる方法を調べます。

100本ノックの0~9までの準備運動は既にやっていたので次のポストでそれをはてなブログに乗せます。(多分そこだけは独力で解いたから著作権的にもNo Problemなはず。)

 ここでは、10~下記サイトを読みながら、Importantなところ(よくわかんなかったところ、参考サイト)だけ書いていきます。

素人の言語処理100本ノック:まとめ - Qiita

この人は全部独力でやって8ヶ月で解き切ったらしいけど、僕はまあ全体の概要なめなめして、使う時に理解に労力さけばいいっていうスタンスで、ほぼコピペで検証して、動くか動かないか、動かなかったらどういうものをして動くか、てことに重点を置いていきます。

 

10:テキストファイルの行数カウント

・概要

なんかPythonでやったのと、Bash on ubuntuのwcコマンドでやったのおんなじ行数にならねえ。encodingを指定する必要があった。

・参考

素人の言語処理100本ノック:10 - Qiita

ファイル読み書き | Python-izm

 

11:タブをスペースに置換

・概要

Python .replace(x,y)メソッド(xをyに置換)

Ubuntu tr expand sedコマンドを使う

・よくわからなかった

UNIXコマンドラインの計算のところで正規表現の理解が必要になりそうだけど、この先で詳しく触れそうなので今のところ放置

・参考

素人の言語処理100本ノック:11 - Qiita

 

 

12:1行目をcol1.txt 2行目をcol2.txt

・概要

Python: with openでテキストを開く、新規に作って、Read とWrite

Ubuntu:cut > でt食って、 diffで2つのファイルの差を確認してくれう

参考サイドの全Pythonコードに僕のPC(Windows10)だとencodingでutf-8を指定しないとテキストファイルopenできなかった

(ちなみに元のテキストファイルが文字化けしているので僕はコマンドの検証は文字化けしたまま行っています(クソ)

・よくわからなかった

cut コマンドと diffコマンドの詳細は不明

--fieldsでテキストファイルの列()columを指定って感じかな

・参考

素人の言語処理100本ノック:12 - Qiita

 

13:12の2つをMerge

・概要

Python:上記と同じ、テキスト参照とファイル作成して、

空白(Space)削除、\t(タブ)挿入してマージ

Ubuntu:pasteコマンドで2つのテキストファイルのMerge、diffでCheck

・よくわからなかった

参考サイトにはPthonのスペース、タブ、改行などの文字コード、文字列リテラル("\t","\n",etc)のことが詳細書いてあるけど、C言語のprintfの中にあるやつと同じ感じだろうで放置

・参考

素人の言語処理100本ノック:13 - Qiita

 

14:先頭N行を出力する(NはInput)

・概要

Python:inputをnにSubstractして、iをダミーにforループ、i ==nになったらBreak

Ubuntu:参考サイトはシェルスクリプトを使って、echo readでインプットを受け取ってる。

僕はシェルスクリプトを作るのが面倒なので(えぇ)普通にbash

read n
head --lines=$n hightemp.txt

 

で先頭n行カット、出力成功を確認。

・よくわからなかった

せめてシェルスクリプトくらい作りたいけど、vimがバグってる+vimの使い方わからない。emacsを使う手もありが、インストールしてないし今のところはそこまで優先順位を感じないので放置

・参考

素人の言語処理100本ノック:14 - Qiita

 

15:末尾N行の出力

・概要

Python: readlinesで各行をリスト化して、スライスで-nを使って末尾から取得、forループで出力

Ubuntu:tailコマンドで14と同様、readした後出力

・よくわからなかった

14と同じ感じ

・参考

素人の言語処理100本ノック:15 - Qiita

 

16:ファイルのN等分

・概要

Python:rangeを上手く使って、分割の数だけ新規ファイルをopenで作成、書き込み、

Ubuntu:if then文などが出てきたのでBash上だけでできない。(と思った。)

・よくわからなかった

シェルスクリプト書ける環境は作ろうかー。

・参考

素人の言語処理100本ノック:16 - Qiita

 

17:1列目の文字列の種類を出力

・概要

Python:set()で集合型を使うことによって、要素の重複をキャンセル

要素の追加はaddで、forループで回して行う。

Ubuntu:cutコマンドで、先頭columnを抽出、ソート、重複除外

上記のプログラムをpyファイルに保存して、それもbashで動かして、新しいテキストに出力を保存

diffで比較

cut --fields=1 hightemp.txt | sort | uniq > result_test.txt
python3 main.py | sort > result.txt
diff --report-identical-files result.txt result_test.txt

Files result.txt and result_test.txt are identical

って初めて言ってくれた。

・よくわからなかった

bashコマンドのsort uniqの使い方の詳細は放置

・参考

素人の言語処理100本ノック:17 - Qiita

 

18:各業を3列目の数値の降順でソート

・概要

Python:lines = open(fname,encoding = "utf-8").readlines()と、エンコード方式を指定する必要があった、modeは、rにすると動かなかったが原因は不明。

Python リストの.sort()メソッドで2番目の値を降順reverse=Trueで

Ubuntu:

sort hightemp.txt --key=3,3 --numeric-sort --reverse > result_test.txt
python3 main.py > result.txt
diff --report-identical-files result.txt result_test.txt

 No newline at end of fileと出力されたが、他は一致してる。

・よくわからなかった

・参考

素人の言語処理100本ノック:18 - Qiita

 

19:1列目の文字列の出現頻度の降順でソート、出現頻度も出力する。

・概要

Python:18同様encodingの調整で動いた。

sort()引数なしで、0カラム(名前)の重複でソートして、

itertoolsのgroupbyでカウント、[("NAME",count)....]て感じのタプルのリストで出力してくれるので、再度sort()でindex[1]の要素(count)の降順でソート

出力

Ubuntu:

cut --fields=1 hightemp.txt | sort | uniq --count | sort --reverse

・よくわからなかった

・参考

素人の言語処理100本ノック:19 - Qiita

 

完走した感想

とりあえず思考停止で動いて、ロジックの理解に努めた。

まあ、こんなツールもあるんだなって感じ、必要になった時に、過去のポストを見て、参照して使えるようにブログでまとめとけばいっかーって感じ。

引き続きノックを進めて、自然言語処理Userになるぞー!

参考

言語処理100本ノック 2015

はてなブログに Jupyter notebook を載せるテスト - バイオ系だけどプログラミング始めました

素人の言語処理100本ノック:まとめ - Qiita

網走監獄にいって流氷見てきた

網走、美幌旅行してきました。

網走監獄はとにかく寒かったです。

囚人たちが北海道を開拓して、今の北海道があるんだなって感じでした。

 

流氷はすごい中国韓国アジア系の人々が観光に来ていて、

ロシアの河から流れ着いた水に浮かぶ氷の塊を見るためにここまで集まるか、と感動しました。

まあこれを何か無理やり神秘的に考えるとすれば、ひび割れた流氷をちょうど去年勉強していた位相空間として考えられるかな、流氷を開集合として、とか考えてたけど無理がありました。

まあこんなものでこんだけ人を動かせるなら、まだまだ北海道の地域も他の地域にない特色を持ったものばかりなので、上手くやっていけば北海道は発展するんじゃないかとか、ドリーミングもしてました。

そして白鳥が温泉に入ってて癒やされました。

 

人生で初めて彼女の実家に行くという経験だったのですが、髪の毛ボサボサだし、三日間全部大学の部活のパーカーで過ごしたし、さすがに気を使わなさすぎて彼女の家族からの評価はいまいちだったようでした。

 

彼女からも適当なのはいいけど適当すぎると旅やこれまでのことについて総評を受け、せめて旅行くらいは人にどう見られるか気を使わないとと考えた次第です。

彼女の実家がすごくいい家族で、美味しいものを食べ、快適に過ごしてきました。

気を使われすぎず、もうなんでも話す感じでした。

 

久々に頭にストレスをかけずに平昌オリンピックを彼女の家族とまったり見るという三日間を過ごしたので、なんだか逆に疲れてしまった気もします。

 

さてまた知らないことで頭を満たし、一日中考えて、ストレスフルで狂気を持って生活していきたいと思います。

 

3月の末に埼玉に帰るので、そこでまた周りの人に面白い話ができるように、今しかできないインドアPython、Music madnessになっていきます。