ヴァイスデータベースその3
なんかブログのコメント欄が使えなくなってたみたい・・・ごめんなさい、たぶん直ったと思う。
◇拍手レス
>カテゴリージョーカーに書き込むとエラーになってしまうのでこちらに。どうも御無沙汰しておりますカイクウです。 WSのデータベースとは・・・。 オフィシャルのHTMLを解析してリストを作るという発想はなかったので純粋にすごいと思いました。 個人的にどんな言語を使って抽出しているか教えてほしいです。きっと中身のコーディングは大変なんでしょうねぇ。
ありがとうございます。今現在私が主に使用している言語はC++で、今回の抽出プログラムではそれにperlを組み合わせる形で動かしています。といっても、perlはhtmlソースをとってくるだけなので、構築の動作はすべてC++で処理してます。ちなみに、環境はVS2008となってます。
PRカードの差分構築処理はちょっと手間がかかりますが、メインでやっている処理はそれほど面倒なものではなくて、とってきたhtmlから余分な部分を省いてカード名などの部分をリスト化しているだけだったり(例外処理とか若干苦戦しましたが)。
ヴァイスの公式サイトが各カードのカード番号を使ったURLでリストを構築しているからこそできた手法ですが、案外いろんな使い道がありそうです。
カイクウ | 2010年2月10日 21:01
拍手レスありがとうございました。
>perlはhtmlソースを取ってくるだけ。
URLからHTMLをダウンロードできちゃう方法があったんですね。ぐぐって見たらわかりました。ちょっと私も改造してCGI用のテキストファイルをひねろうかと思います。
プロト | 2010年2月10日 21:23
補足ですが、gethtmlでソースを得た場合、いくつか文字化けが起こるので注意が必要です。ほとんどは例外処理で対処できますが、なのはエクストラのみ、各カードのコスト表記が潰れてしまい、人手による補完が必要になります。
CGIはまたお邪魔させていただきたいと思いますので、そのときはよろしくお願いします。
カイクウ | 2010年2月13日 09:22
どうも、こんばんわ。
コスト表記がつぶれる件
>こちらは、抽出から作成までperlのみで組んでみましたが、文字化けは大丈夫そうでした。(元々perlのコードがeucだからでしょうか?)。
ブースター以外のPRカードとマイヒメ関連が単純な連番になっていなかったので、結構苦戦したりしました。ああ、結局例外としてカード番号手打ちなんですけどね。
CGIのほうはまた機会があればお願いします。
プロト | 2010年2月13日 15:32
>コスト表記
なるほど、私もコードをいじってみることにします。
>PR
あれは・・・かなり面倒ですね。だからこその差分データ収集プログラムを組む運びになったわけですが・・・。