〈
新通留学
菜单

雅思写作的免费评分软件靠谱吗?

2020-11-03

栏目:考培资讯

4人喜欢

导语:

我们在备考的过程中会发现有很多写作免费评分工具,可以对我们写好的作文进行初步的更正和批改,然后再给到一个分数。很多同学在使用软件的时候发现,明明自我感觉是6分的作文,但是系统竟然给到了8分,所以很多同学就想知道这个评分是否真的靠谱呢?

雅思写作雅思写作评分雅思写作评分软件

雅思是一个语言考试,分数反映大家的英语语言水平。但要说雅思的难度仅仅停留在“语言交流”的层面,写作首先不答应。

首先,雅思写作的话题范围涵盖了教育、社会、科技、媒体等等,有的已经远远超出了“日常交流”范畴;许多题目辩证性极强,不仅需要写作者读懂题目,还需要极强的思维能力去面对一个存在争议的复杂话题;有思路也远远不够,还要用符合学术写作的方式,讲自己的思路合理布局,有效展开......

所有这一切要求,仅靠随意的一些拼凑、灵光乍现,肯定是不够应付的。

我们在备考的过程中会发现有很多写作免费评分工具,可以对我们写好的作文进行初步的更正和批改,然后再给到一个分数。

很多同学在使用软件的时候发现,明明自我感觉是6分的作文,但是系统竟然给到了8分,所以很多同学就想知道这个评分是否真的靠谱呢?

本来想给大家的答案是大家可以不要过分依赖这个评分结果,如果想要用这些软件可以着重使用对作文一些语法错误的更正。

但是又想本着科学求实的态度给大家综合评估这些评分标准是否真正可靠,万一这些评分软件的AI非常给力呢?

那么在最开始我们先了解语言水平测试领域中的一个基础概念,当然雅思考试也在语言测试水平的范畴中,这个概念就是interrater reliability,也就是评分者的间信度。

简单来说就是同一篇作文由两位批改考官进行给分,然后再看两位考官给出的分数有无差值?如果两位不同的考官给出的分数比较一致,那么间信度就比较高,反之则是较低。

但是对于我们平常使用的写作免费评分软件来说,无论使用什么算法,对于我们来说最重要的就是机器给出的分数是否和官方评分一致,所以就需要测试二者的间信度是否足够高?

本着求实的态度,我们找到了剑桥真题集标有官方评分的考生范文,并且将其输入到目前几家主流免费批改软件或网站中。

通过输入满分作文,我们发现极少有软件会给作文打出超过8以上的分数,所以我们在统计过程中对考官范文进行了单独的分类。

同时也说明对于写作高分选手来说,AI批改就不尽如人意,如果写作目标是7分以上的同学,建议选择更有针对性的人工批改。

为了避免不必要的拉踩,我们此处不再公布软件或网站的具体名称。

大多数评分软件或网站给我们从真题集摘下的作文打的分数以5-7分为主,这看似大概符合多数人的写作水平。

呢么我们先从最基本的分差来看,小作文和大作文的数据偏差范围都较大。

也就是说机器评分和真题集中官方给分差值相差3分及以上,这种极端情况普遍出现在目前主流的各种写作评分软件网站中。

其次我们来看看官方给分以及写作软件或网站给分的间信度,无论是大作文还是小作文连0.20(即slight agreement略微一致)的标准都有点难达到,也就是说评分软件或网站的给分与官方真题集中给到的分数偏差较大。

通过再次分析大作文,我们发现官方会给出5.5或6.5的分数,但是一般来说多数评分网站只能取整数,并不会给出半分,所以也导致了大作文的给分整体较高。

所以这也就常常出现明明自我感觉6分,但是评分软件却给了7+分数的原因。

另外通过我们的大量测试,输入文本的时候如果分段或者标点符号有错误,会较大程度影响给分。

由于大部分写作评分的算法维度都是围绕拼写或者句法错误展开的,所以如果大家想要对作文进行一个初步的订正和修改,一部分写作评分软件或者网站还是可以做到的。

虽然软件之间由于算法的差异,会有略微不同,但是这部分还是有一定的参考价值。

那么如果我们按照雅思官方给分标准,从写作评分标准中的这个维度:即写作任务回应情况来说,大部分写作评分系统都是不限定写作题目的算法。

所以对于图表类小作文的批改来说其实这部分的给分是非常不客观的,而大作文也有同样的问题。

所以如果想要对自己的写作水平有更精准的把控,写作评分系统的参考价值其实并不大。

其次第二个维度,连贯和衔接,熟悉评分标准的同学都知道,其中反复强调的一个点就是组织信息和论点的能力。

那么论点也是围绕作文题目及主题展开的,所以这个维度的给分也会不够客观。

雅思写作想要得高分,首先要解决的是逻辑上的问题。逻辑有如骨架,撑起一副合理的躯干;否则再好的语言也会发生方向性失误。

拿到这个题目,不关注题目中逻辑的同学,会急着去给一个立场,比如不同意;然后在论述的时候往“人为什么要帮助别的国家的人”这个方向去动脑筋。然后这样的话,其实题目中另外一半就完全被忽略了,也就是“国内就有这么多需要帮助的人”这个事实。如果完全不理会这个事实,仅仅只是论述“人为什么要帮助其他国家的人”,就没有很好的考虑到为什么有人会产生题目中的观点,他们的assumption是什么,这种assumption是否正确,从而落入一种“你说你的,我说我的”的局面。

所以从审题的时候,我们可以有四个步骤:

1. 关注题目中的逻辑关系(因果、目的...)

2. 评估题目中的assumption是否正确

3. 评估题目中的结论是否正确

4. 形成全文段落布局(立场+主体段的关系)

按照这个步骤走下来,我们很自然的,会先用一个段落去承认题目中assumption的正确性——国内的确有很多需要帮助的人,政府也应该优先帮助他们;接下来一段再反驳结论——然而,这不意味着政府不应该为其他国家提供国际援助,有一些国家无力解决自己的问题......

所谓“思辨”,就在这里体现出来了。并不是机械的告诉自己,写写对方的好,再写写自己的好。而是真正深入题目,在考虑对方得出结论的预设前提,评估到底是这个预设出了问题,还是结论出了问题。

接着是,【产生思路的逻辑】

许多同学拿到题目之后,都能够产生一些观点,但是却不会重新“审视”自己的观点。

举个例子:

In what ways has technology affected the types of relationship people make?

面对这个题目,许多同学能够产生一些ideas,比如:

1. 人们可以在网上聊天,不需要面对面

2. 现在人们保持联络很方便

3. 社交网络比如Facebook,Instagram变得很普及

4. 人们也可能比较孤独,因为没有面对面的交流

5. 以前人们很容易和住得远的亲戚朋友失去联络

于是在写段落的时候,就将这些ideas完全不加处理的拼凑在一起:以前人们很容易和住得远的亲戚朋友失去联络,现在人们保持联络很方便,人们可以在网上聊天,不需要面对面,社交网络比如Facebook,Instagram变得很普及。但人们也可能比较孤独,因为没有面对面的交流。

可是我们来细看就会发现,以上5个ideas,前1,2,3,5其实说的是同一件事,区别只是在于1和3讲得事实,4是做对比,2是针对这些事实的概括性评价。4好像说得没错,但是没有在回应题目中的affect the types of relationship people make这个主题。

而完全不经审视的个人观点,不去寻找自己观点之间的逻辑,就会造成段落缺乏核心论点,内容非常杂乱,上下句毫无联系,等等一系列的问题。一旦产生这样的问题,用词再优秀也救不了你的作文了。

还想了解更多留学相关信息,你可以进入【新通教育天津官网】留学资讯一手掌握!

拨打400-618-8866【点击咨询】,得到新通留学顾问详细的解答! 

点击 【录取率测试】 免费评测,提前了解留学实力! 

定制备考方案
获取备考方案