AKSARA-CLM-v1 / model /evaluasi_hasil.json
emylton's picture
Upload model/evaluasi_hasil.json with huggingface_hub
5b6c6f4 verified
Raw
History Blame Contribute Delete
4.38 kB
{
"e1": {
"skor": 0.7,
"detail": [
{
"valid": "Peneliti itu mempublikasikan temuan barunya ke jurnal internasional.",
"invalid": "Peneliti itu publikasi temuan baru ke jurnal internasional.",
"margin": -0.044843,
"lulus": false
},
{
"valid": "Hakim memutuskan bahwa terdakwa terbukti bersalah.",
"invalid": "Hakim putuskan terdakwa terbukti salah bersalah.",
"margin": 0.071239,
"lulus": true
},
{
"valid": "Semua siswa mengerjakan tugas mereka dengan tekun.",
"invalid": "Semua siswa kerjakan tugas mereka dengan tekun tekun.",
"margin": 0.02677,
"lulus": true
},
{
"valid": "Pemerintah menetapkan kebijakan baru untuk sektor pertanian.",
"invalid": "Pemerintah tetap kebijakan baru sektor pertanian.",
"margin": 0.069682,
"lulus": true
},
{
"valid": "Dokumen penting itu ditandatangani oleh direktur utama.",
"invalid": "Dokumen penting itu tandatangan direktur utama.",
"margin": -0.022988,
"lulus": false
},
{
"valid": "Warga desa membangun jembatan baru di atas sungai.",
"invalid": "Warga desa bangun jembatan baru atas sungai.",
"margin": 0.039954,
"lulus": true
},
{
"valid": "Tim peneliti menganalisis data dari berbagai sumber terpercaya.",
"invalid": "Tim peneliti analisis data berbagai sumber percaya.",
"margin": 0.031953,
"lulus": true
},
{
"valid": "Menteri Pendidikan meluncurkan program pelatihan bagi guru.",
"invalid": "Menteri Pendidikan luncur program latih bagi guru.",
"margin": 0.070614,
"lulus": true
},
{
"valid": "Pengusaha muda itu mengembangkan bisnis teknologi pertanian.",
"invalid": "Pengusaha muda itu kembang bisnis teknologi pertanian.",
"margin": -0.117268,
"lulus": false
},
{
"valid": "Anak-anak bermain di taman pada sore hari yang cerah.",
"invalid": "Anak-anak main taman sore hari cerah.",
"margin": 0.06512,
"lulus": true
}
]
},
"e2": {
"skor": 1.0,
"detail": [
{
"root": "sinkronisasi",
"bentuk": "menyinkronisasikan",
"lulus": true
},
{
"root": "partisipasi",
"bentuk": "memartisipasikan",
"lulus": true
},
{
"root": "transformasi",
"bentuk": "menransformasikan",
"lulus": true
},
{
"root": "akselerasi",
"bentuk": "mengakselerasikan",
"lulus": true
},
{
"root": "digitalisasi",
"bentuk": "didigitalisasikan",
"lulus": true
},
{
"root": "optimalisasi",
"bentuk": "mengoptimalisasikan",
"lulus": true
}
]
},
"e3": {
"skor": 1.0,
"detail": [
{
"deskripsi": "Proposisi baru: teknolog mengembangkan algoritma",
"kalimat": "Teknolog mengembangkan algoritma di laboratorium",
"lulus": true
},
{
"deskripsi": "Proposisi pasif baru: sistem dioperasikan operator",
"kalimat": "Sistem dioperasikan oleh operator",
"lulus": true
},
{
"deskripsi": "Proposisi atribusi: kebijakan adalah reformasi",
"kalimat": "Kebijakan menjadi reformasi",
"lulus": true
}
]
},
"e4": {
"skor": 1.0,
"detail": [
{
"deskripsi": "Vonis hakim → status terpidana (chain 1 langkah)",
"lulus": true
},
{
"deskripsi": "Aksi membeli → kepemilikan (chain 1 langkah)",
"lulus": true
},
{
"deskripsi": "Keputusan pejabat → dampak kebijakan (chain 2 langkah)",
"lulus": true
}
]
},
"e5": {
"skor": 1.0,
"entitas": 10,
"inferensi": 0,
"detail": [
{
"test": "resolusi referensi",
"lulus": true
},
{
"test": "akumulasi inferensi",
"lulus": true
},
{
"test": "query ke konteks",
"lulus": true
}
]
}
}