mr.Bones Mar/27/2023 14:57

自作ツール「5chLogChanger(5ch過去ログ整形名人)」のリリース

ども、mr.Bonesです。

私は重度のねらーなので、昔は浪人とか買って5ch(旧2ch掲示板)の過去ログスレッドをよく漁っていました。最近はそこまでではないので、過去ログを閲覧する際は専ブラ+浪人ではなく、通常のブラウザ上から閲覧で済ませています。

ただ、やはりブラウザからだと見づらいし、特定のキーワードで抽出とか出来ないので不便です。で今回作ったツール「5chLogChanger(5ch過去ログ整形名人)」になります。覚えにくいので日本語の名称を付けました。

【5chLogChanger(5ch過去ログ整形名人)】

5chの過去ログスレッドのHTMLファイルからHTMLタグや投稿時に貼り付けられた画像タグを除去(URLの文字列は残します)し、テキストファイルに整形して保存。整形済テキストからキーワードが含まれるレスを抽出(複数の整形済テキストから一括で抽出)するツールです。

【変更履歴】
Version 1.0 2023/2/9
・初版作成
Version 1.1 2023/2/12
・一部整形済テキスト変換でタグが残っていたのを修正。
・整形済テキストの自動保存先を元のHTMLと同じフォルダから指定してある保存先フォルダに変更
・指定した抽出キーワードを含むレスのみを抽出するワード抽出機能を追加
Version 1.2 2023/2/12 1:13
・保存先のパスで末尾に\がつかずに整形済テキストが保存出来ていないケースがあったのを修正
Version 1.3 2023/2/12
・5chの過去ログのHTMLタグのパターンが年代によって違うため、タグ除去及び抽出に対応出来ていないパターンがあったのを修正。
(違うパターンはまだあるかも。見つけたら連絡頂けるとうれしいです。)
・ドラッグ&ドロップ及びメニューの開くで複数の過去ログHTMLを開いて、一括で整形テキスト変換出来るように修正。
・上記に伴い大量のファイルをテキスト変換すると時間が掛かるのでプログレスバーを表示するように変更。
Version 1.4 2023/2/12 18:17
・高DPI環境だと1行で表示すべき内容が折り返される可能性があるので、テキストの領域を大きくしました。
Version 1.5 2023/2/13
・対応パターンを増やしました。板や時期によってパターンが違うので先は長そう・・・。
Version 1.6 2023/2/15
・対応パターンを増やしました。
Version 1.7 2023/2/15
・日本語のツール名称を変更
Version 1.8 2023/3/07
・対応パターンを増やしました。(したらば掲示板。したらばは専ブラで過去ログみれるけど) ←古いファイルを上げていたので、再アップロード。
Version 1.9 2023/3/12
・HTMLのエスケープ文字を個別に置換していたのをSystem.Web.HttpUtility.HtmlDecodeメソッドでデコードする方式に変更。(三国志系の名前もイケる筈)
Version 2.0 2023/3/25
・整形済過去ログテキストをツリーに表示する機能及び選択したツリーのテキストをリッチテキストに表示する機能を追加。
Version 2.1 2023/3/27
・したらば掲示板でテキスト整形が対応出来ていないパターン、異様に抽出に時間が掛かるパターンがあったのを修正。

使い方

【テキスト変換】
1.Chrome等の通常のブラウザで5chの過去ログスレッドを開き、「全部」表示を選択した後、右クリックメニューの名前をつけて保存を選び、自分のPCに保存する。
2.5chLogChanger.exe(本ツール)を立ち上げます。
3.ツールのタブが「テキスト変換」になっていない場合はタブを切り替える。
4.(お好みで)開いたHTMLファイルを以下のディレクトリに自動保存するにチェックを入れます。
5.「ここに5chの過去ログHTMLファイルをドラッグ&ドロップして下さい。」というメッセージの場所に1.で保存したHTMLをドラッグ&ドロップします。
6.5chの過去ログスレッドのHTMLからタグや画像リンクのタグ(リンクの文字列は残ります)を除去した整形済テキストを出力し、3.でチェックボックスにチェックを入れてある場合は「XXX.html」→「XXX.txt」として保存先(初期設定は本ツールのexeと同じ場所)に保存されます。

【整形済テキストの参照】
1.画面左のツリーに表示されている整形済過去ログテキストの一覧から任意の過去ログを選択する。
2.キーワード抽出タブのリッチテキストに整形済過去ログテキストが表示されます。
3.特定のキーワードが含まれている書き込みのみを抽出したい場合は、任意の抽出キーワードを入力し、抽出ボタンを押下。抽出結果を参照して下さい。

【キーワード抽出】
1.任意で対象スレッドにキーワードを入力します。(未入力の場合は保存先の全テキスト*.txtが対象)
2.抽出キーワードを入力します。
3.抽出ボタンを押します。
4.下のリッチテキストボックスに抽出キーワードを含むレスのみが抽出され、抽出キーワードがハイライト表示されます。

【Q&A】
Q.スレッドタイトルが微妙に揃っていなくて、関連スレッドが順番通りに並びません。
A.本ツールの整形済テキストの保存ファイル名はスレッドタイトル名ではなく、整形前のHTMLファイル名を元にファイル名を決定しています。

例えば以下のような【オリジナルファイル名】HTMLファイルから整形テキストを作成する場合、予め【修正ファイル名】のようにリネームしてからテキスト変換を実施することで、整形済テキストが画面左のツリーに順番通り並ぶように調整出来ます。

【オリジナルファイル名】
[転載禁止] hogehogeプログラミング 2冊目(c)2ch.net ©2ch.html
[転載禁止] hogehogeプログラミング ©2ch.net.html
hogehogeプログラミング 3冊目.html
hogehogeプログラミング 4冊目.html

【修正ファイル名】
hogehogeプログラミング 1冊目.html
hogehogeプログラミング 2冊目.html
hogehogeプログラミング 3冊目.html
hogehogeプログラミング 4冊目.html

以上です。

その他

そのうちJavaScriptで焼き直してChrome拡張機能に移行するかも。

この過去ログの整形がまだ対応出来ていないから対応して!とコメント欄に書き込んで頂いたら、優先的に対応するかも・・・。

私と同じく5chの過去ログ漁る重度のねらーの方は良かったら使ってみて下さい。

それでは。

フォロワー以上限定無料

自作ツール「5chLogChanger」

無料

この記事が良かったらチップを贈って支援しましょう!

チップを贈るにはユーザー登録が必要です。チップについてはこちら

\いいね・ツイートで記事ランキングアップ!/
ツイート

月別アーカイブ

限定特典から探す

記事を検索