(最近の動きと)4月からの話
4月からは職を得て、東京で生活している。 なにも出力していない日々が続いたので、一先ず現状をまとめておく。
4月からは職を得て、東京で生活している。 なにも出力していない日々が続いたので、一先ず現状をまとめておく。
随分と時間が空いてしまった。
一昨年の初冬に4年ぶり二回目の緊急搬送で一命をとりとめ、昨年の初夏あたりに取り敢えず治療が一段落した。 その半年のうち半分以上は入院生活を余儀なくされ、さらにその期間の半分は高熱にうなされロクに生活できたものではなかった。
気づけば一年が過ぎ、その間にかろうじて残されていた糸を手繰り、どうにかこの 春から仕事を始める ……というとこれまでニートだったかのようだが、この春からは他所様にも胸を張って紹介できる定職に就く。
2024年に入ってからも色々あったが、ようやく落ち着いた気がするので、整理のためにつらつらと書いてみる (と言いつつすでに面倒になってきた、心情を吐露すれば全て文字に起こして文章にまとめてくれるAIくんはいつ出るだろうか、もうあるかな)。
動機:
色々考えることがありすぎてフリーズしてしまいがちなので、テキストに出力して整理するとともに、手を動かして擬似的にやる気を発生させたい
というわけで現在 2023/07/04 の午後 4 時すぎ、色々考えていきます
前回の記事では、構想を練るところまでやった。
苦節一ヶ月、ついに実現し毎日自動でデータを集め、それが BigQuery にロードされるようになったので、苦労した点をつらつらと書いていく。
ML4Keiba に関する昨年の記事でも書いたように、ローカルだけでなくクラウド側にデータを保存し、それらをクラウド上の DB におさめて分析あるいはサービス提供できるようにしたいと考えている。
そんな折、以下の書籍を読む機会があり、そこでおおよその方向性がつかめたのでそれをまとめる。
一言で言えば、 Cloud Functions x GCS x BigQuery で DWH をつくる構想 といったところだろうか。
気づけば 2023 年も一ヶ月が過ぎてしまった。 自分の中ではまだ12月半ばなのだが、そうなってしまったのは再度病院送りになって時間間隔が狂ってしまったことが原因だろう。
とはいえ、頭を切り替えて春〜夏以降に備える必要はある。 療養生活を怠惰に自堕落に過ごして目を背けてきたことと、改めて対峙する。
前回までの記事では、 ML4Keiba の理想的な機能について考えた
今回は、具体的にどのようにデータを「状態」として保持するか・引き出すかを考える (まぁつまり ETL ってやつだ)
半年近く放置してしまったが、どうにかして本ブログの諸々を更新した
特に、docusaurus
を v2.2 まで上げられたのは快挙であろう
「~を利用して」という表現には「個々人に "集めさせる"」という意図がある。 すなわち、Twitter API を個人で利用する分にはたかだか50万 tw/month 程度までしか収集できない一方で、複 数人の力を合わせればその量を N 倍に増やせるという企みである。
じゃあ、どうやってそれを実現するのか?ということを考えているので、それをメモしておく。
ML4Keiba としてデータを集めるのはいいが、その後についてきちんと考えをまとめていなかった。 マイルストーンというほど定かではないが、現在考えているいろいろなことをメモとして残す。
What までは書いてあるが、実際の具体的な How については自分の頭の中にあるだけだ。 これもどこかきちんと出力しておきたいが……また別の問題が生じるかもしれないので、後々考えることにする。