ta-dadadadaのブログ

忘備録とポエム

prickathon#4 に参加してきました

概要

参加させていただきました。

prickathon.connpass.com

実は前回(#3)も出ていたんですが、レポ書き出遅れてるうちに出し損ねました。今回こそ。

できたもの

https://pri-story-search.herokuapp.com/

プリティーシリーズの各話を探す API を作りました。

モノ自身は python で flask を使ってできていて、終盤時間が余ったので heroku にデプロイしてみました。 レスポンスは json の漢らしいヤツ。

パラメータは series が必須で、 subtitle やら scenario やらをオプションにして部分一致検索できます。

今考えると series は url に含めるべきな気がしてきたのでそのうち直します。

やったこと

午後から参加したこともあり軽くデータ弄って何かやろう、ということで wikipedia から各話リストをスクレイピングしてくることを思いつきました。 で、はじめは beautiful soup とかでいい感じに web スクレイピングしてこようとしてたんですが、 1時間ほど格闘したものの思う通りの形でできなかった(主に知識不足で、いい感じにテーブルの処理ができなかった)ため、 スクリプトでやることを投げ出してコピペ&スプレッドシートでの温かみのある作業に移行。 一応温かみがあったのは日付の処理くらいで、最低限やったら csv に吐き出して pandas に読み込み、 セル結合のおかげで欠損値になる部分などだけ処理してやって json に加工する、ということをやってました。

search についても極めて原始的な文字列部分一致をかいて、あとは適当に flask で返せるようにした、というのが今回の成果です。

今回は合計してもせいぜい数百行にも満たないデータだったので生の json をソースに含めて読み込んでしまったけれど、 あまり頭のいい検索の実装とは言えない感じがするので、もう少しデータ構造を工夫するなり、 sqlite でいいから DB をバックエンドにしたかった気持ちはあります。

その辺あまりきちんとしなかったおかげで逆にさらっと heroku にデプロイできたとこもあるので、総合的には良い判断だったのかもしれません。

プリッカソンそのものの話

スペースとお菓子とプロジェクターが余るほどあり、 プリティーシリーズの が絶え間なく流れる非常に過ごしやすい環境でした。

途中キンプリとキンプラを同時に摂取する事態に見舞われながら(何も言っているかわからない)、 それにも動じずにコーディングを続ける参加者たちはたいへん訓練された女児だなあと感服する次第です。

プリパラの星の下に集う仲間たちということもあり(?)、 全体的にフロント畑の参加者が多い印象があったんですが、 ブラウザアプリやら画像検出やら画像分類やらゲームやらARやら音楽やら、 成果物については幅広く出揃った感があってとても刺激になりました。

個人だけでなく参加者間でチームになって企画を進められると、 すごく面白いものができそうな期待感に満ちているので、今後もハッカソンを継続していただいて、 そういうことにもチャレンジしていけたらいいなーとわくわくしています。

以下余白

プリッカソン公式ステッカー。なかひこ氏の力作。一晩でやってくれました。 私物にステッカー貼るのって女児ですよね。

懇親のピザを頬張りつつ、ライブと成果発表を同時に眺めるの図。

懇親のピザを頬張りつつ、2つの成果発表が並列処理されそうになるのを眺めるの図。