投稿記事

アプリケーションの記事 (21)

PersonalToolProject 2024/01/30 23:27

[アップデート報告] - DOM:Alpha (RJ01011621) Ver2.1.4

アップデート Ver2.1.4

いつもこのアプリを利用して下さってありがとうございます。

今回のアップデートは次となっています。


Ver2.1.4

  • サークル、声優、タグ、シリーズの編集とイメージプレビューでUIが特定な解像度で切れてしまう現象を修正
  • config.jsonの場所に即座で飛べるクイックボタンを追加
  • 各作品に同封されているテキストファイルの形態素解析機追加
  • 形態素解析マイグレーション機能追加
    ‐ データローダー及びシリーズデータマイグレーション機能臨時除去(詳しくは詳細で)

今回この前報告させていただいた件でやむを得ず急いで未完成なままでバージョンアップしてしまいました。誠に申し訳ございません!

この件に関しての詳し内容はこちら
https://ci-en.net/creator/17397/article/1058514



ここからは今回のアップデートの内容となります。

config.jsonファイルの場所まで即座で飛べるようボタンを追加しました。


本来機能を強化する予定だった形態素解析機能(テキストマイニング)を未完成ですが、最初の問題により早めにアップデートしました。
各作品に含まれているテキストファイルを読み込んで使われてる品詞を分析してみる事が出来ます。
使用頻度によって表示される色とか透明度が変わります。
この機能によって事前に読みこむテキストファイルのエンコーディングの情報を知る必要があるのでその情報を追跡する機能も追加されました。
ですので以前のようにいちいちエンコードを選ぶ必要がなくなりました。


マイニングされた品詞はこのように単語ごとに使われている回数を見る事が出来ます。


今回のアップデートによって最初にDOMを起動するとこのように「TokenizeDB.sqlite」ファイルが自動的に生成されます。
これはテキストマイニング専用のデータベースです。
今はただ見せるだけのデータですがこれから機能を高度に展開する予定ですので消さないようお気をつけてください。


この機能は日本語をメインにしますが、日本語は様々なエンコーディングが存在するのでDOMで追跡出来ないエンコーディングが存在するかもしれません。
その場合は当サークルに是非お問い合わせをお願いします。




言語には色んな品詞が存在するのでセッティング画面で必要な品詞を選べるようにしました。
この機能は「Novel Supporter」と言うテキスト検査に特化されているテキストエディターで使われているOpenAPIを基にしていますのでそのAPIで検出する品詞をそのまま取り入れたものです。


最新バージョンのDOMをダウンロードすると「dict」というフォルダがあります。
このフォルダの中のファイルはテキストマイニングの為の日本語辞書です。
消されないようにお気をつけてください。
tokenizer.exeはテキストマイニングすると生成される形態素解析のプログラムです。
このファイルによってプログラム全体の容量が最大約150MBまで増えました。


最初にアップデートをダウンロードした後「セッティング画面」→「マイグレーション」に接近してマイグレーションを行うのをお勧めします。
マイグレーションをしなくても各アーカイブのテキストファイル閲覧のボタンを押すことでもその作品のテキストマイニングは起動しますが、新しいテキストファイルの閲覧のたびにその作業によってテキストファイルを読む時間が伸びます。
より快適な使用の為に先にマイグレーションを行うのをお勧めします。

テキストマイニングのプロセスは1000作品ごとに約一時間位かかります。
(各作品に含まれているテキストファイルによって偏差はあります。)

データベースの位置のところをクリックすると現在のデータベースファイルの位置までショートカット出来ます。

最後に画面の解像度によって各サークル、声優、タグ、シリーズの情報を修正する時のUIとイメージプレビューでボタンが切れてクリック出来なくなる現象を直しました。


今回のアップデートはここまでです。
思わぬ事態によって未完成のままアップデートしてしまって申し訳ありません。
近い内に完成版をアップデートしたいと思います。

ちなみに前回の投稿の件でDLSiteのミラーデータベースの構築を始めました。
データローダーはこのサーバーは整った後復活させたいと思います。
申し訳ありませんが、その時まで是非お待ちください!

いつもありがとうございます!
今後もよろしくお願いします!

ダウンロードはこちら(*アップデート内容の反映は少々時間がかかります。)

今回のアップデートバージョンは「ver2.1.4」です。
https://www.dlsite.com/home/work/=/product_id/RJ01011621.html

バグの報告や機能追加のリクエストはこちら

https://ci-en.net/creator/17397/article/801491

その他のリクエストはこちら

https://ci-en.net/creator/17397/article/801500

PersonalToolProject 2024/01/12 01:42

DOM:Alphaの次回アップデート(Ver2.1.4)の開発進展報告

少し遅くなりましたが、開けましておめでとうございます。

次のアップデートに向けて順調に開発は進んでいますが、チェックリストが多すぎて
この辺で中間報告をさせていただきたいと思います。

次のアップデートのVer2.1.4では次のアップデートが予定されています。
1.各作品のテキストファイルのエンコーディングを自動追跡
2.各作品のテキストファイルをスキャンし、形態素解析機能追加
3.2で分析した形態素をデータベース化及び登録済みの作品のマイグレーション。
4.分析した形態素の中で使用者にとって要らない単語を排除したるするハンドリング機能
5.各サークル、声優さん、タグにサブタグとして形態素の割り当て
6.サブタグの統計ページ開発

この記事を残している現在3番までは開発は終わりました。
ですが4番からの作業がかなり手が込む内容ばかりなので完成までは相当時間がかかると思います。

まず、3番までの機能を簡単に紹介しますと、
1番のエンコーディングを自動追跡機能はあくまで形態素解析機能を完成させるための内部機能的のオプションに過ぎなかったですが、思ったより精密度がまぁまぁよかっやのでUI レベルに引き出しました。
Ver2.1.4からはマニュアルでエンコードを設定する必要がなくなります。

2番は外部の日本語形態素解析ライブラリーを導入しました。精密度が優れていますがその分ブログラムの容量が増えてしまいました。
増えても100mbを超えることはないと思います。

3番は今までの登録済みの作品を全体的にスキャンしてテキストファイルを見つけ出し、それを形態素解析処理とデータベース化するマイグレーション機能です。
処理速度は「50作品/約40分」ぐらいです。
勿論各作品に添付されている台本の数や内容の長さによって大きな差はあります。

作業は終わるとこのようにTokenizeDB.sqlite というファイルが作られここに分析が終わった単語を管理する形となります。

4番からかなり長い作業になると思いますので次のバージョンを期待していらっしゃる方々の為にこの辺で中間報告をさせて頂きました。
是非気長に待って頂ければ幸いです。

いつもありがとうございます!

PersonalToolProject 2023/12/27 22:21

[アップデート報告] - DOM:Alpha (RJ01011621) Ver2.1.3

アップデート Ver2.1.3

いつもこのアプリを利用して下さってありがとうございます。

今回のアップデートは次となっています。


Ver2.1.3

  • 各作品にメモを残せるように改善
  • アーカイブ追加、修正の時作品コードのトリミング機能追加
  • ささいなバグの修正


今回は二つの機能が追加されました。
一つ目としては、アーカイブ追加や修正する画面で作品コードのところにURL等コードの長さより長いテキストをCopy&Pasteした後Shiftキーを早く2回打つ事で有効なコードをトリミングする事が出来るようになりました。(正確的には0.5秒内に2回打ちます。)

実際やってみると…

このようにURLを丸ごとコピペした後Shiftキーを早く2回打つと


このように有効なコードを切り抜くことが出来ます。
これをトリミングと言います。
もちろんこの機能はデータローダーにも反映しました。
トリミング対象の優先順位は次となっています。
‐ 8桁のRJコード
‐ 6桁のRJコード
‐ Fanzaの無料作品コード
‐ Fanzaの有料作品コード

この中で最初に当たるコードがある場合次の検索はやめます。
分かりやすく説明させていただくと、もしコピペするテキストの中に
RJ000000/d_000000

このような内容だ場合
適したコードであるRJ000000が検出されたのでそのあとのコードはトリミングの対象としては見れずRJ000000のみを残して他のは切り抜く仕組みになっております。
ここら辺はご注意お願いします!

次の機能としては、各作品にメモを残せるようになりました。

メモがある場合アーカイブでサムネールイメージの左下にこのようにアイコンが表示されます。
このアイコンをクリックするとメモを見たり修正する事が出来ます。

このメモはDOMでの検索機能では引っかからないようにしましたが、もしリクエストがある場合検索のキーワードとして認識できるようにアップデートしたいと思います。

次のアップデートとしてはテキストマイニングを最近研究しているのでこのあたりのアップデートが行えると思います。

テキストマイニングのModuleの開発はある程度進んではいますが、肝心なのは既存のDBや作品をどうやってマイグレーションするのかが悩みです。
意味のない単語を除いてユーザーの意思で選別するためのUIの設計も含めてやる事は多いと思いますが、念入りにテストして次のアップデートに反映したいと思います!

もしバグのレポートがある場合はそちらの方を優先したいと思います。
いつもありがとうございます!
今後もよろしくお願いします!

ダウンロードはこちら(*アップデート内容の反映は少々時間がかかります。)

今回のアップデートバージョンは「ver2.1.3」です。
https://www.dlsite.com/home/work/=/product_id/RJ01011621.html

バグの報告や機能追加のリクエストはこちら

https://ci-en.net/creator/17397/article/801491

その他のリクエストはこちら

https://ci-en.net/creator/17397/article/801500

PersonalToolProject 2023/11/30 21:56

[アップデート報告] - DOM:Alpha (RJ01011621) Ver2.1.0

アップデート Ver2.1.0

いつもこのアプリを利用して下さってありがとうございます。

長い間お待たせ致しました!
今回のアップデートは次となっています。


Ver2.1.0

  • 再生可能なAudio format追加 (.ogg, .acc, .m4a)
  • FANZA発の作品アーカイビング支援
  • ささいなバグの修正

ついにFANZAから購入した作品も登録出来るようになりました!
DLSITEで作品をRJから始まるユニークなコードを各作品の発給して管理しているのと同じくFANZAではcidと言う規格で作品を管理しています。(d_000000 or d_000000zero)

そのコードをDOMに登録できるようになりました。
勿論DataLoaderでもcidが認識されたら自動的にFANZAにアクセスして情報を収集するよう機能を強化しました。
ただ、FANZAでは作品の声優さんの情報をデータとして扱わないので声優さんを情報を収集する事が出来ませんでした。😫
いつか解決したいと思います!

今回は外見的な多い変化はないですが機能的にちょっと大型アップデートだったので2.0.9ではなく2.1.0にヴァージョンアップしました。

前のヴァージョンを利用した方は必ずお読みください!
ver2.1.0からFANZAからご購入なされた作品も登録可能になりました。
その作業の一環でやむを得ずデータベースのマイグレーションを行いました。
なのでもしver2.1.0を一度でも起動しましたらデータベースの構造が変わりますので
そのデータベースをver2.1.0以前のヴァージョンで使おうとすると想定できないエラーが発生する可能性があります。

勿論とある状況であってもDOMによってデータが消される可能性は絶対ないですが、もしすでにver2.1.0を一度でも起動したうえで前のヴァージョンに戻りたいと思う方は方法がありますので対応の為こちらにお問い合わせをお願いします。
お手数をおかけしまして申し訳ありません!



次のアップデートとしてはこちらの機能を考えております。

‐ 作品評価の範囲を細かくしたいと思います。
今は評価の単位が★一個づつですが★半分も適用出来るようにしたいと思います。

‐ SE無しとかwaveファイルを自動圧縮出来るようにしたいと思います。

‐ アップデートしたらDOMを使う時に直ぐ分かるようにしたいと思います。

これからもよろしくお願いします!

ダウンロードはこちら(*アップデート内容の反映は少々時間がかかります。)

今回のアップデートヴァージョンは「ver2.1.0」です。
https://www.dlsite.com/home/work/=/product_id/RJ01011621.html

バグの報告や機能追加のリクエストはこちら

https://ci-en.net/creator/17397/article/801491

その他のリクエストはこちら

https://ci-en.net/creator/17397/article/801500

PersonalToolProject 2023/09/10 23:24

[リリース報告] ランダム文字ゼネレーター

こんにちは!Personal Tool Projectです。
こちらのアプリを利用して下さってありがとうございます。

今回新たなアプリをリリースする事になってご報告させていただきます。


今回発売したプログラムは 「Random Glyph Generator」 です。

乱数を基として様々なオプションを設定するとアルゴリズムによってランダムに文字を生成してくれるツールです。
創作活動に当たってとある国や種族が使う文字体系を作ったりする時に役に立てたらと思いこのようなプログラムを開発しました。

生成してくれる文字体系は次の要素と1対1に対応します。
1.アルファベット小文字
2.数字
3.括弧
4.四則演算記号等

操作可能なオプションとしては大まかに
1.乱数の種
2.サイズ比率
3.文字を構成するグリッドの割合やサイズ
4.曲線の強さや頻度
5.画数関係の変数
となっています。


もし曲線を強めにするとこのような形で文字を生成します。

生成した文字はPNG形式でセーブする事も出来ます。

PNGファイルはある程度加工を加えたらフォントクリエイター等の専門ツールで実際のフォントにすることも出来ます。


以上です!

既に登録の手続きはしましたけど、反映は少々時間がかかりそうです。
反映は確認出来たらURLを追加してこの投稿を修正します。


このツールの反応が良ければこの先もオプションを増やしたり利便性を強化していきたいと思います。

これからもよろしくお願いします。

« 1 2 3 4 5

記事のタグから探す

月別アーカイブ

限定特典から探す

記事を検索