近日,Examstar发布了测试评估领域首个垂直大模型,在此发布之前已在多个项目中进行了测试。 大模型具有垂直化、场景化、精度高的特点,融合了语言大模型、图像大模型、多模态大模型,可帮助企事业单位解决招聘、认证、人才能力评估等场景,提供更加智能高效的解决方案。
2024年是Examstar成立的第10个年头,专注数字考试领域10年,目前Examstar平台上注册企业55万家,共交付157万**次考试,服务近亿考生。 2021年,考星创新性地提出了行业内“认真考”的理念,通过纯在线方式实现了**考试和**监考,确保了**考试的公平性; 2023年,Examstar陆续发布了多项基于大模型的功能和解决方案,进一步提升各类考试场景全流程的效率和准确性。
业界首个垂直测试评估模型的发布,是基于多年的行业洞察和服务经验,在拥抱领先的大模型技术的基础上,在测试评估领域的又一里程碑。 在整个考评过程中,大模型可以解决命题、监考、评分、评价等全过程的智能解决方案。
在命题方面,LLM智能解题,通过对53万道试题的微调训练,已经可以支撑大部分通用场景的题目需求,以及171个专业资格考试和专业领域认证的题目需求。 认证项目经过测试后,使用LLM智能问题解决可以降低95%的解题成本,解题效率可以提高14倍以上。
在监考场景中,通过手势识别、面部识别、语音内容监控等方式实现多模态AI辅助监考,并根据一定的算法将考试中的作弊倾向划分为多个级别,从而实现分级精准监考,大大提高了初试的监考效率。 基于超过200万次考试产生的作弊行为数据库,监考效率提升10倍。
在LLM评分场景中,经过1100万份试卷的数据训练和模型微调,经过项目测度,现在可以通过人工评分实现90%和95%的速度,达到可信和可用的状态。 可应用于各种主观试卷的评分,评分效率提高7倍以上。 2024年,我们还将与多家机构开展深度合作,打造行业内大规模LLM评分的试点和标杆。
除了一般大型模型技术厂商外,Examstar还将与清华大学开展多模态大型模型战略合作,推动大型模型进入行业。 未来,ExamStar将与越来越多的企事业单位开展规模化模型业务的深度合作,探索和优化考评领域的多场景,推动考评领域的高质量发展。