ExamStar 发布测试评估领域首个垂直模型

小夏 教育 更新 2024-02-04

近日,Examstar发布了测试评估领域首个垂直大模型,在此发布之前已在多个项目中进行了测试。 大模型具有垂直化、场景化、精度高的特点,融合了语言大模型、图像大模型、多模态大模型,可帮助企事业单位解决招聘、认证、人才能力评估等场景,提供更加智能高效的解决方案。

2024年是Examstar成立的第10个年头,专注数字考试领域10年,目前Examstar平台上注册企业55万家,共交付157万**次考试,服务近亿考生。 2021年,考星创新性地提出了行业内“认真考”的理念,通过纯在线方式实现了**考试和**监考,确保了**考试的公平性; 2023年,Examstar陆续发布了多项基于大模型的功能和解决方案,进一步提升各类考试场景全流程的效率和准确性。

业界首个垂直测试评估模型的发布,是基于多年的行业洞察和服务经验,在拥抱领先的大模型技术的基础上,在测试评估领域的又一里程碑。 在整个考评过程中,大模型可以解决命题、监考、评分、评价等全过程的智能解决方案。

在命题方面,LLM智能解题,通过对53万道试题的微调训练,已经可以支撑大部分通用场景的题目需求,以及171个专业资格考试和专业领域认证的题目需求。 认证项目经过测试后,使用LLM智能问题解决可以降低95%的解题成本,解题效率可以提高14倍以上。

在监考场景中,通过手势识别、面部识别、语音内容监控等方式实现多模态AI辅助监考,并根据一定的算法将考试中的作弊倾向划分为多个级别,从而实现分级精准监考,大大提高了初试的监考效率。 基于超过200万次考试产生的作弊行为数据库,监考效率提升10倍。

在LLM评分场景中,经过1100万份试卷的数据训练和模型微调,经过项目测度,现在可以通过人工评分实现90%和95%的速度,达到可信和可用的状态。 可应用于各种主观试卷的评分,评分效率提高7倍以上。 2024年,我们还将与多家机构开展深度合作,打造行业内大规模LLM评分的试点和标杆。

除了一般大型模型技术厂商外,Examstar还将与清华大学开展多模态大型模型战略合作,推动大型模型进入行业。 未来,ExamStar将与越来越多的企事业单位开展规模化模型业务的深度合作,探索和优化考评领域的多场景,推动考评领域的高质量发展。

相似文章

    无纸化测试评估,提高效率,节约成本

    随着考试规模的不断提高和信息技术的不断发展,国家越来越重视保密和考试事务的管理,借助现代信息技术的无纸化考试和评估将继续引领行业的发展,既可以提高考试事务的效率,又可以节省人力,物质资源和其他成本。无纸化考试评估的优势 无纸化考试评估以电子方式进行,以实现高效 便捷和环保的考试过程。优点是 节约成本...

    香港中文大学咨询 学校招聘 在线评估 在线考试 过去的考试 考试中心 及格技巧

    香港中文大学咨询认知能力测试考察语言理解 数据分析和图形推理题型与公务员考试类似,难度还是挺大的,所以建议多刷真题,提高通过率 中大顾问 考试理论上只有一次机会,如果是社会招聘,也可以联系HR申请复试,但希望不大,一定要重视,多准备 .语言理解 香港中文大学辅导质素评估的言语理解 类型一 用词选择填...

    2024STEP考试时间公布! 新赛季 新的考试委员会公布了考试的更多细节

    STEP考试时间公布!每年都有许多学生因为没有达到STEP分数而被拒绝。这位官员还明确表示,要想通过STEP考试,至少需要提前半年练习和准备。step sixth term examination 这是在申请牛津剑桥等数学专业时必须提供的数学附加测试 它也是伦敦帝国理工学院等学校被用作数学专业的入学...

    华为发布首款星光套装,首次实现星光生态闭环体验

    月日,华为再次举办新品发布会,为我们带来了华为MatePad Pro 英寸典藏版,华为MatePad Pro 英寸星光套装和 HUAWEI MatePad Pro 英寸星光套装。这三款套装包括一款平板电脑 华为首款星光键盘 华为智能磁吸键盘 StarFlash 和华为M Pencil 第三代 手写笔...

    Ichijian考试大纲已经发布!每个部分的整体变化都应该充分理解!

    年一级建造师考试大纲已经出炉,考试科目包括 建筑工程经济 建筑工程规程及相关知识 建筑工程项目管理 专业工程管理与实务 当然,具体知识内容的变化以最终出版的教材为准。建设项目管理管理整体变化 整体章节顺序和章节框架都进行了调整,从原来的章调整为章。增加了项目投资管理制度 卓越绩效管理 综合综合管理 ...