ビッグデータ?
ちょっとずつ過ぎるのですが、RestHouseの前記事を書き出す作業が多分成功したのです。
一つのファイルが2MBとか3MBぐらいなので、テキストファイルとしては大量という感じですけど。
こうして見ると、なんでか解りませんが、良く続いていますね。
それはどうでも良いのですが、久々のPythonを使ってやっと書き出せたのですが、これからどうするのかはまだ決まってなかったり。
とりあえず余計なHTMLのタグとかは消さないといけないので、これもスクリプトでなんとかするのですが、間違ってせっかく書き出したものを台無しにしないように気をつけないといけないのです。
ついでに書くと、PythonでMySQL(MaridaDB)のデータを取り出すと勝手にリストとか辞書になっているので良いですね。
Perlでやったときは「良く解らないけど上手くいく方法」で、自分なりに配列とかハッシュにしてたのですけど。
でも次の作業はPerlが楽に違いないです。
この辺のどの言語にするか?という問題は臨機応変に選んだほうが良いかも知れません。
コメントする