Han, N., 植田, 暢., 大嶽, 匡., 勝又, 智., 鎌田, 啓., 清丸, 寛., 児玉, 貴., 菅原, 朔., Chen, B., 松田, 寛., 宮尾, 祐., 村脇, 有., & 劉, 弘. (2024). llm-jp-eval: 日本語大規模言語モデルの自動評価ツール. https://www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/A8-2.pdf