Per-Session Breakdown

16 sessions evaluated · grouped by sessions.title · 2 consumer + 14 enterprise

consumer

16 answers · 0 passed

Mean correctness 0.37 · Mean opening 0.43

enterprise

84 answers · 0 passed

Mean correctness 0.53 · Mean opening 0.41

All Sessions

most recent first · click a row to expand questions

Session Title	Tier	Role	N	Pass	Correctness	Completeness	Context	Context	Opening	Voice	Faithfulness
best buy — Quick Practice	consumer	unknown	13	0%	0.34	0.23	0.44	0.18	0.44	0.66	0.55
Quick Practice	consumer	unknown	3	0%	0.49	0.52	0.60	0.39	0.39	0.69	0.48
Stripe — AI enginner (Copy 104)	enterprise	unknown	4	0%	0.73	0.73	0.62	0.89	0.27	0.60	0.46
Stripe — AI enginner (Copy 96)	enterprise	unknown	1	0%	0.89	0.87	0.90	0.90	0.41	0.25	0.75
Stripe — AI enginner (Copy 88)	enterprise	unknown	1	0%	0.84	0.60	0.89	0.22	0.39	0.52	0.74
Stripe — AI enginner (Copy 87)	enterprise	unknown	1	0%	0.90	0.89	0.89	0.92	0.49	0.62	0.71
Stripe — AI enginner (Copy 15)	enterprise	unknown	6	0%	0.66	0.59	0.73	0.63	0.48	0.28	0.73
Stripe — AI enginner (Copy 12)	enterprise	unknown	19	0%	0.74	0.59	0.77	0.44	0.45	0.33	0.71
Stripe — AI enginner (Copy 3)	enterprise	unknown	5	0%	0.21	0.12	0.20	0.03	0.43	0.39	0.53
Google — AI ml engineer	enterprise	unknown	6	0%	0.48	0.26	0.34	0.07	0.33	0.29	0.40
Google — AI enginner (Copy 5)	enterprise	unknown	2	0%	0.68	0.66	0.54	0.89	0.61	0.53	0.36
Google — AI enginner (Copy 6)	enterprise	unknown	25	0%	0.42	0.37	0.31	0.57	0.42	0.39	0.22
Google — AI enginner (Copy)	enterprise	unknown	1	0%	0.47	0.29	0.47	0.26	0.33	0.30	0.39
Google — AI enginner	enterprise	unknown	8	0%	0.13	0.01	0.01	0.20	0.06	0.04	0.01
Google — AI enginner (Copy)	enterprise	unknown	2	0%	0.73	0.81	0.71	0.80	0.69	0.44	0.61
Google — AI enginner	enterprise	unknown	3	0%	0.73	0.69	0.75	0.80	0.70	0.55	0.58