设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

AI帮忙填高考志愿靠谱吗?实测百度、腾讯、阿里、智谱等9款产品

发布时间: 来源:

21世纪经济报道记者 王俊 王峰 实习生 刘欣、朱奕潼 北京报道 5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

高考志愿填报还在火热进行中。今年,AI大模型志愿填报成为亮点。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

志愿填报是高考后的关键环节,像山东、贵州等省份实施新高考后需要填写 96个志愿,提高了信息获取的要求和难度。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI具有推理优势,近年来已经有不少公司在推出AI填报志愿。尤其是随着大模型的崛起,不少大模型产品也相继入局。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但是,这些产品性能如何,给出的志愿推荐是否具有参考性,误差有多大?5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

21世纪经济报道记者测评了夸克、文心一言、百度AI志愿助手、腾讯元宝、天工AI、通义千问、智谱清言、靠谱AI、作业帮9款产品,结果发现均存在一定问题,尤其是文心一言、腾讯元宝、天工AI、通义千问、智谱清言等大模型产品,误差率高。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

测评发现问题包括:5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

1、上述提及的大模型产品推荐误差率高。志愿推荐的“冲、稳、保”三个档次准确率低,存在“冲”的学校历年分数线低于“保”底学校。通义千问、智谱清言甚至出现给黑龙江省内排名4000左右的学生推荐冲刺清华、北大的建议给山东排名64000名的学生推荐冲刺北京航空航天大学的建议。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2、底层数据缺失,即时数据更新不及时,一些推荐学校在该省份并无招生计划。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3、个性化推荐不够智能,选择志愿目标城市为北京,但文心一言、智谱清言等产品中出现多个学校并非北京高校。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

根据艾媒咨询数据,2023年中国高考志愿填报市场付费规模为9.5亿元,近九成高考生愿意选择高考志愿填报服务,市场规模持续增加。AI产品想要吃下市场红利,目前的产品能力仍有较大不足。 5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大模型产品误差率过大 排名4千名考生推荐冲击清北 

此次测评的产品分别为:夸克、百度文心一言、百度AI志愿助手、腾讯元宝、天工AI、通义千问、智谱清言、靠谱AI、作业帮。上述测评产品主要是在应用商店、网页、小程序等搜索AI志愿,弹出的排名靠前的产品。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了客观、准确反应AI产品志愿填报的能力与精准度,21世纪经济报道记者分别用不同省份、高分段与中分段进行了测评,并且进行了二轮交叉检验。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

测评首先设计了两个测评人设:5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

1)黑龙江考生,628分,排名,选科为物理、化学、生物,目标城市北京,想选择人工智能相关领域专业。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2)山东考生,考分558分,排名约64000,对城市与学校没有相关要求,专业覆盖人工智能、航空航天。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在一款产品的“智能填报”页面上,输入高考总分、选科等基本信息,系统会推荐“冲、稳、保”三种不同风险类型的志愿和录取概率预测。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

进一步按照院校优先、专业优先、职业优先等筛选条件来缩小选择范围。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

高分段实际测评情况:5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM


5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

测评的9款AI志愿填报产品中,主要分为两种类型:一种为在线“志愿一键填报”,主要应用是大数据技术,考生输入相关信息,系统根据各院校专业往年的录取分数、位次进行匹配,自动生成填报建议,包括按照“冲”“稳”“保”给出不同层次的推荐结果,包括各专业最近几年的录取最低分、最低位次、招生计划,以及预估的录取概率等。夸克、作业帮主要是这一类型。 5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另外一种则为大模型产品,用户与大模型对话,得到更充分的填报建议,也有志愿表格推荐等形式,文心一言、腾讯元宝、通义千问、天工AI等属于该类型。靠谱AI两种形式皆有。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

记者根据历年分数线、排名、招生计划,对上述9款产品所推荐的结果进行判断,整体来看,AI大模型给出的推荐结果靠谱程度低于传统AI的志愿填报系统。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以黑龙江高分段考生为例,测评结果显示,百度的文心一言,它推荐的冲刺类型学校为上海交通大学和中国科学院大学,上海交通大学是上海的学校,其不符合测评考生的目标城市北京,并且,根据2024年中国科学院大学的本科招生分省分专业计划表中,中国科学院大学没有黑龙江招生计划。推荐的“稳”学校为北航、北邮和华科往年录取学生排名大概在1000、2000以内,而测评考生排名4千名左右,“稳”和“保”难度较大。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通义千问和智谱清言则将清华和北大作为测评考生的冲刺学校,作为排名4千多名的考生,这两所学校冲刺的可能性极低,误差较大。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

夸克、靠谱AI和作业帮这四款产品也存在一定误差,比如夸克推荐保底的学校北京师范大学,历年在黑龙江的录取排名大概在三千名,也并非完全可以“保”的学校。不过整体来看,传统AI志愿填报产品误差率小于大模型产品。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM


5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

再来看中分段的推荐结果,大模型产品误差仍较大。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

文心一言推荐结果不稳定,用同样的考生条件多次提问,给出的答案大有不同,甚至会出现同样的学校专业推荐出现在不同档次的填报中的情况。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

同时,文心一言、腾讯元宝、天工AI、通义千问给出的志愿填报推荐参考价值不高,对于排名64000名的考生却推荐要求排名在5000名及以内的学校,出现了985院校作为保底志愿填报进行推荐的情况,比如文心一言和智谱清言推荐排名64000名的考生冲刺北京航空航天大学,通义千问则在“保”的推荐中出现了北京航空航天大学。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大模型产品往往给出的推荐建议没有以往名次与分数线提供参考,而是与提问中的专业等关键词更加贴近,这也与大模型的属性有关。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI志愿填报 仍有较大不足

在互动性方面, AI大模型产品的互动性更强,不仅局限于简单的一问一答模式,还会根据用户的指令智能调节后续问题的深度和广度,比如在高考志愿填报的背景下,它们一般会就模型推荐的填报志愿学校、专业的具体情况和就业前景等提供进一步的咨询服务,文心一言、腾讯元宝、天工AI、通义千问和智谱清言都会在回复下面提示,“你可以继续问我:上海交通大学近几年的分数线是多少呢,北京有哪些好大学等问题”。夸克、靠谱AI和作业帮等传统AI的志愿填报系统互动性不够,与产品定位重点不同有关。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

测评的志愿填报产品中,大部分没有广告与后续付费要求。夸克、文心一言、AI志愿助手、通义千问、智谱测评中未发现广告与后续付费情况。天工AI需要分享才能查看志愿详情,靠谱AI则会限制每个用户免费使用的次数,同时,若想进一步获得更多消息也需要付费升级会员。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2014年以来,全国共有29个省份分五批启动了高考改革。新高考模式下,报志愿的难度提升,高考志愿填报成了一门热门生意,“钱景”广阔。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI志愿填报近年来“水涨船高”,大模型的快速迭代,性能提升,成为今年志愿填报市场一股新增量。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大模型产品互动性更强,人机对话形式降低了志愿填报产品的使用门槛,可以用聊天的方式获取信息和建议。并且测评显示,互动过程中,不少产品也能抓取更有针对性的资料给到用户。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但是,大模型产品对数据有强依赖性,底层数据的缺失或是测评中大模型产品志愿推荐不靠谱的主因之一。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

中国教育科学研究院研究员储朝晖在此前接受21世纪经济报道采访时表示,目前考生填报志愿存在几个难点,第一个是高校的招生简章当中没有准确表述招生诉求,第二个是高校公开的数据的质量、标准不一样,比如不同学校的同一个专业,内涵是有差异的。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,最关键的是,有些院校专业并未及时公布最近的录取分数线、录取位次等数据。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一位高考志愿填报产品负责人告诉21世纪经济报道,基础数据的准确和全面,是他们每年花最多精力来打造的事情,要动用上百人的人工标注团队来处理数据。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

缺乏对院校专业权威的评估体系和评估数据,大模型志愿填报精确性难以提升。从测评结果来看,想要真正在志愿填报的红海中立足,大模型还有一段距离要走。5ZY速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

随着历史的车轮驶入2024年,大模型、AIGC等话题引发广泛热议,云计算与AI技术展现出了前所未有的深度融合趋势,就如同寒武纪的生物大爆发,激发着各行各业的创新浪潮。新质生产力时代到来,政企用云进 3月18日,中国经济信息社(以下简称中经社)垂直领域数字化应用系统发布仪式在北京举行。在发布仪式上,锚定建设“国家级经济信息旗舰”的目标,中经社推出了八大数字化应用系统。中经社此次发布的行 记者从国家航天局获悉,3月20日8时31分,探月工程四期鹊桥二号中继星由长征八号遥三运载火箭在中国文昌航天发射场成功发射升空。科技日报记者 付毅飞 摄火箭飞行24分钟后,星箭分离,将鹊 3月18日,伴随着搬运车的轰鸣声,全国首个大规模清洁能源特高压直流输电工程的送端±800千伏特高压祁连换流站迎来了一位“新成员”——1号调相机转子,该换流站第7次年度检修工作 记者3月21日获悉,全球植物科学期刊《分子植物》刊载了中国科学家的最新研究,中国农业科学院作物科学研究所、国家南繁研究院与阿里达摩院(湖畔实验室)联合研发出全流程智慧育种平台,实现了育种数 作为月之暗面的创始人,杨植麟常把他的AGI梦想形容为“登月计划”,长文本就是这个伟大计划的第一步。但现在,随着Kimi的爆火出圈,赛道瞬间变得拥挤,24小时内,阿里、360、百度紧急“出手”,纷 。

本文链接:AI帮忙填高考志愿靠谱吗?实测百度、腾讯、阿里、智谱等9款产品http://www.sushuapos.com/show-2-7394-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 长六改火箭成功发射天绘五号02组卫星

下一篇: 南财数据周报(第七期):国家数据局今年将推8项制度文件,多项国际合作文件共促数据跨境

热门资讯

  • 全国首个煤炭行业能源智算中心在山西建成

    3月18日,记者从山西省人民政府获悉,“山西煤炭工业互联网智算平台”日前在山西联通大数据中心建设完成。该平台由中国联通与山西晋云互联科技有限公

  • 马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI

      马斯克用行动反击 开源自家顶级大模型 压力给到OpenAI  《科创板日报》3月18日讯(编辑 宋子乔) 似乎是为了表明自己始终坚持对AI模型开源,马斯克做出了与阿尔特曼全然

  • 阿尔茨海默病早期症状可能表现在视力上

    据阿根廷布宜诺斯艾利斯经济新闻网报道,一项国际研究发现,阿尔茨海默病的早期症状可能表现在视力上。研究显示,即便眼科检查结果正常,但阅读、估计距离

  • CRISPR能消除培养细胞中艾滋病病毒

    荷兰阿姆斯特丹大学医学院科学家开展的一项新研究证明,利用最新CRISPR-Cas基因编辑技术,能消除实验室中受感染细胞内所有艾滋病病毒(HIV)的痕迹,为治愈

  • 锻造能“听”清眼疾的高精设备

    眼眸深邃似海、璨如星河,中国医学科学院生物医学工程研究所眼科诊疗技术研发团队(以下简称“团队”)正是眼眸“侦探”。该团队不久前被授予“国家卓越

  • 科学新发现丨有史以来最大的三维宇宙地图发布

    根据《天体物理学杂志》的最新报道,一个国际天文学家团队利用欧洲空间局的盖亚(Gaia)太空望远镜收集的数据,创建了迄今为止最庞大的三维宇宙地图。该地

  • 香港科技大学推出首批“AI讲师” 开拓创新教学新模式

    3月19日,记者从香港科技大学获悉,该校以人工智能生成式工具设计出10位“AI讲师”, 这些“AI讲师”来自世界各地,属不同民族及文化背景。该校希望通过创

  • 突发!Kimi,崩了!

    因流量突然剧增,3月21日,陆续有用户在社交平台上表示,月之暗面旗下大模型应用Kimi智能助手的APP和小程序均无法正常使用。截至记者发稿时,相关

  • 女性比男性更易失眠?什么原因导致?专家分析

    造成女性更容易睡不好的原因是多方面的,包括更年期等生理周期等,而女性长期的失眠除了会导致内分泌进一步失调,还会诱发心脏病、高血压、糖尿病、免疫

  • 科学家提出人类性别决定新理论

    3月18日,记者从中南大学生殖与干细胞研究所获悉,研究所林戈、卢光琇教授团队提出的一项新理论称,原始生殖细胞的性染色体组成在人类性别决定中起关键

  • 中国气象局发布下一代大气数值模式

    中国气象局下一代大气数值模式日前发布。该模式采用完全自主的动力框架算法——多矩约束有限体积方法为基础算法,进一步提升全球公里级和

  • 首款骁龙8 Gen3折叠屏!vivo X Fold3图赏

    3月23日消息,vivo X Fold3系列将于3月26日正式发布,成为全球首款骁龙8 Gen3折叠屏电话。现在这款新机外观已经解禁,下面为大家带来图赏。vivo X Fold3提供

推荐资讯

  • 日榜
  • 周榜
  • 月榜