Merged
Conversation
10カテゴリのエッジケース評価データ(edge-cases.tsv)を追加。 現時点の結果: 98/129正解(76.0%), 誤分割0%, unsplit 31件(24.0%) カテゴリ: - 漢字姓+ひらがな名 / 漢字姓+カタカナ名 - かな姓+漢字名(未対応) - 名前内部にかな混在 - 1文字姓 / 3文字以上の姓 - 異体字・旧字体 - ノ・ヶ・々を含む姓 - 全ひらがな/全カタカナ - 分割が曖昧な名前 Ref #8 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- internal/eval/ を廃止し、全テストを test/ に統合 - カテゴリ別ディレクトリ(12種)にテストファイルとデータを配置 - 共通ヘルパー(test/helper.ts)でTSVデータドリブンテストを実行 - VTuberテストデータ(30件)を追加 - 実辞書未生成時はスキップする安全機構付き - npm run eval → vitest でカテゴリ別テストを実行 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
npm test で全テストが実行されるため不要。 eval は JS の予約語と紛らわしいアンチパターン。 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- test/helper.ts: ローカル生成データがなければ npm パッケージ (seimei-split) から辞書を取得するフォールバックを追加 - .github/workflows/test.yml: push/PR時にテスト実行 - npm install seimei-split で公開済み辞書を取得(2.8GBダウンロード不要) Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
- vitest の verbose 出力からカテゴリ別正答率を抽出 - sticky-pull-request-comment で PR に毎回上書きコメント - push/PR 両方で実行、コメントは PR 時のみ Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
Test Results
Unit Tests: 13 passed files, 50 passed tests |
vitest はソースを直接読むためビルド不要。 生成データがなければ npm パッケージから辞書を取得する。 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
import("seimei-split") だと自パッケージと衝突するため、
node_modules/seimei-split/dist/index.js から直接 import する。
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
vitest の色付き出力がレポートに混入していたため、 sed でエスケープコードを除去してからパースする。 Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
Summary
internal/eval/gold/edge-cases.tsv)を追加npm run evalで MVP + edge-cases の両方を評価するように更新現時点の結果
unsplit の内訳(31件)
誤分割は 0 件で、全て安全側(unsplit)に倒れている。
Ref #8
Test plan
npm run evalで両データセットの評価が実行されるnpm run test(ユニットテスト) に影響なし🤖 Generated with Claude Code