XML?の解析

さて大分久しぶりです。
HSPで作るゲームのほうもそれなりに進めてますよ。しかし今回自分の実力にあわないでSLGを作ろうとしたせいかやはり終わりがなかなか見えてこない。よって別のことをやってます。それはタイトルの通りなんですけどXMLの解析です。
なんのXMLかというとCGIゲームが出力するXHTMLです。まあ実際はHTMLファイルだったわけですけどまあそれはともかくとして、何のゲームかというと人狼BBSです。
でそうやっていろいろやってたんですけどXMLパーサがファイルを読み込んだ段階で失敗してました。使ってみたパーサはrubyの標準パーサのREXMLとC#のXmlTextReaderクラスで、両方に読み込ませたんですけど両方ともうまくいきませんでした。
自分で作ったTestファイルを読み込ませた場合だとうまくいくのでひょっとして人狼のログファイルがXMLに準拠してないのかなあって思ってソース見てみたら案の定でした。
タグを閉じないで使っているようだし間違いないでしょう。というか私はこんなことにも気づかずにやってたんですね。やっぱりまだまだ未熟です。


とりあえずXMLパーサで直接ログを読み込ませるのは無理だとわかりました。ということはHTMLパーサを使って読み込ませるかRSSXMLパーサに読み込ませるかのどちらかをするしかないですね。
RSSで足りるなら標準機能に付属されてるXMLパーサが使えるので多分そのほうがいいです。目的は一応統計的に「狼はどういう人間なのか?」的なのをやろうと思ってたので、必要なものは役職と発言のデータは最低限必要かな?でRSSの中身を見ると役職はただ単にRSSだけで得るのは無理っぽいですね。ということはHTMLパーサを使うしかないわけで。


まあとりあえずここまで結論が出ただけで前進したので今回は良しとしておきます。目的を果たすところまでいくのかは微妙ですけどね。