データ解析でmdbを使う時

データをmdbに入れて解析することが定期的にある。昨日もごにょごにょやってたけど、mdbって便利だけどなにかをきっかけに非常に使いにくくなる。昨日は何時間かいじったあげくこりゃだめだと見切って別の高機能なdbに変えたらあっさり解決した。はまる前にさっさと見切り付けて別のdbに入れた方がいいな。

これは前々から何度も今まで感じていた。

しかし、見切りを付けるきっかけがまだ明確にならない。だってmdbでもできるんだからね。
それあんたがmdb知らないだけでしょと。


SQL構文が特殊
数値集計機能が変な気がする
データ型が特殊な気がする
データ件数が多いと遅い
など機能的なものも原因はあるのだが、決定的なのは思考がなぜか中断されること。


全然スッキリしないけど経験的に10万件以上のデータを解析する時はすぐにmdbを使うのを止めようと思う。 今後はすぐにmysqlかsqlite3に入れよう。ORACLE使えるならそっちがなれてるから楽だけど。持ち運びを考えるとsqlite3だね。mdbをやめられない理由は持ち運びや他の人もとっつきやすいというのがあるな。


高機能なdbで解析してからmdbに解析結果を入れるというのが1番ハマらなそうだ。


以前は解析などに3日とか2日かかってたけど、最近なら1日か・・。1時間まで縮めないとな、昨日も2時間あれば終わると思ってたのに結局は5時間くらい取られたかな。データ件数が多い時のmdbはハマると憶えておこう。どんな内容に対して何日というのが無いので、書いててちと変なのだがまー色々だよね。毎回やること変わるんだから、ただ必ずパターンはあるから考え抜いて高速化しないとね。

あらゆるものにパターンは常に存在する。
蜘蛛の巣は全てユニークだが、できている過程は皆同じである。