关键词:
文本知识(精选十篇)
文本知识 篇1
关键词:领域知识,文本分类,层次结构
面对Internet上日益膨胀的信息,如何快速、准确地从浩瀚的信息资源中寻找到相关内容成了研究热点。文本自动分类已成为一项具有较大实用价值的关键技术,是组织和管理数据的有力手段。传统的文本分类方法常见方法是基于向量空间模型。
传统分类方法并没有考虑到词之间的语义关系,现实文本中实际用词往往是有关联的,如同义词、上下位关系等,而文档向量空间把文本看作是由一组正交词条向量所组成的向量空间,这种方法的假设前提是词与词之间没有语义上的联系,从而丢失了大量的语义信息,对只有和其他特征同时出现时才对分类有贡献的特征并未考虑。为克服以上不足,不少研究者提出基于领域本体的文本分类方法。
1 相关工作
1.1 本体
本体(Ontology)是一个哲学上的概念,是客观存在的一个系统的解释或说明,关心的是客观现实的抽象本质。Neches,Fikes等人将Ontology定义为“给出构成相关领域词汇的基本术语和关系,及利用这些术语和关系构成的规定这些词汇外延的规则的定义”。Gruber提出一种比较详细的表达,即ontology是对某一领域中术语及术语之间关系的规范而明确的说明。典型Ontology包含5个基本的建模元语,分别为:类,关系,函数,公理和实例。
1.2 Ontology中概念之间关系的量化
文献[1]探讨了一种无需训练文本和特征项抽取的文本分类方法。通过Hownet建立一个Ontology,然后根据分类体系建立每个类的Ontology,将领域本体中概念之间的关系数量化,最后根据每个类的Ontology对文本进行分类。其具体方法为:由知网(Hownet)得到Ontology dict_On,建立每个类C的Ontology的方法为,dict_On中查找C或与C同义的概念,将dict_On中的关系看作边,概念看作点,那么dict_On可看作一张图,C或与C同义的概念是图中的一些点。以这些点为中心,保留与中心点距离较小的N个节点,得到T_on。
对一个概念来说,和C的关系从某种程度上决定了与该主题的相关程度。在计算T_on中概念与中心点间相关度时采取以下方法:将图中的关系分为四类,分别用R1,R2,R3,R4表示。R1为Similarto关系(同义关系)和Instanceof关系,规定这种关系的权重为w1;R2为PartOf关系(整体部分关系),这种关系的权重为w2;R3为RelationTo关系(相关关系),规定这种关系的权重为w3;R4为subclass关系(上下位关系)和其他关系,规定这种关系的权重为w4。权重衡量的是两个概念由于具有某种关系致使彼此之间相关程度的大小。
公式的含义是如果这条边是关系Ri,边上的距离为1减去这个关系的权重。
(t为与中心点距离较小的概念,C为某一类别主题,α为可调整参数)。w_len(t,C)看作无向图中两概念之间的最短距离。
1.3 基于Ontology的分类法
基于Ontology的分类法Classify(W_T)
输入:所有类的Ontology,待分类文本W_T;
输出:W_T所属的类
算法描述:
步骤1:根据第i个Ontology,找出W_T中出现的且Ontology中含有的概念,计算这些概念在W_T中出现的次数;
步骤2:计算W_T与类i的相似度。
其中Sim(W_T,i)表示W_T与类i的相关程度。O表示类i的Ontology,ft W_T表示概念t在W_T中出现的次数,wt O表示概念t与类i的相关程度,由公式(2)Sim(t,C)得到。
步骤3:返回Sim(W_T,i)最大的i,即为文本W_T所属类别。
1.4 基于领域本体的文本分类
文献[2]中提出基于领域本体的文本分类,如图1是SARS本体的一部分,对于本体树不同层次的概念提出了权值计算公式。本体树中概念的位置决定了其抽象程度,概念的初始权值为
规定根结点的层次为0,h为当前结点的层次,H为包含该结点的分支树的高度。如Concourse Antisepsis对应的H为4,h为2,当结点为非叶子时,其概念权值调整为
K为常数2,n为当前结点到最底端结点(分支中有最长路径的分支)的距离。
由公式(4)和(5),如图1的所有概念权值对应如表1。
2 领域本体层次结构的改进及在文本分类中的应用
2.1 基于Ontology分类算法的不足
文献[1]中对领域内的概念同等对待,在计算W_T与类i的相似度时采用的是,对于上层抽象的概念尽管其类别表征能力比较弱,并没有赋予一个比较低的权重,同时没有突出具有比较强类别特点的低层概念对类别的贡献率。对分类的影响在类别比较相近的时尤为明显。从文献[1]中实验也可以看出,其环境、经济、军事类的召回率处于40%-60%,大部分都被错分到政治类中。
2.2 领域本体中概念权重的计算
本文以领域本体为基础,提出文本特征选取时概念特征权值的改进方法。在领域本体中的概念之间语义关系量化基础上,利用概念间的结构层次特点,根据不同概念的抽象程度,提出其量化公式。
基于领域本体的文本分类即将本体中相关概念和文本中表达的概念进行比较,选出与文本相似度最大的某一类别。领域本体中概念之间的关系数量化为分类提供了一种新方法,领域本体同时提供了概念之间的一个概念树层次结构,图2是某网站新闻网页的主题概念树,本文选取对经济中的农业作细化,我们可以充分利用领域本体的层次结构信息,对于不同层次的概念予以量化,有助于类别的划分。
处于不同层次的概念具有不同的抽象能力,较低层概念是其上层概念的子类或实例,因此对于某一类别的细分,下层概念比上层概念有更强的区分能力。如某篇文本中对于粮食生产与经济对应的概念同时出现对于类别贡献不同,因为比较上层的抽象概念在多类别中出现的概率大于低层的具体概念的出现概率。本文提出以下公式对不同层次概念作出区别:
Tt为概念t的权重,α,K为可调整参数(可根据实验调整),n为以当前概念所在结点为根的树的高度,若图1中层次细化到图示为例,如图3。
文献[2]中提出的领域本体层次结构在文本分类中的应用是尽可能将文本表达的主题映射到到具体的概念中,与文[2]不同的是,本文利用这一层次结构目的是加强本类别中更具体概念表征本类别的能力,同时又不过于削弱上层概念对本类别的贡献。
以α=1,K=1为例,由公式(6),则对应概念的权重如图4。
2.3 基于Ontology新的分类算法
利用概念在对应类所形成的概念树中的权重,本文提出基于Ontology分类算法的改进。
基于Ontology分类法改进Classify_w(W_T)
输入:所有类的Ontology,待分类文本W_T;
输出:W_T所属的类
算法描述:
步骤1:根据第i个Ontology,找出W_T中出现的且Ontology中含有的概念,计算这些概念在W_T中出现的次数;
步骤2:计算W_T与类i的相似度。
其中Sim(W_T,i)表示W_T与类i的相关程度。O表示类i的Ontology,ft W_T表示概念t在W_T中出现的次数,wt O表示概念t与类i的相关程度。由公式(2)Sim(t,C)得到,Tt O表示概念t在类i中的概念树中权值,由文中的公式(6)得到。
步骤3:返回Sim(W_T,i)最大的i,即为文本W_T所属类别。
该算法在计算待分类文本W_T与类i的相似度时采用的公式改为:
这样就把概念层次结构中的上下位概念之间区分类别能力予以数量化,进一步挖掘出了本体所含的概念层次信息。
2.4 文本分类的评价
文本分类的评价标准类似于信息检索的评价标准,包括精度(查准率)和召回率(查全率):精度是分类的正确文本数与实际分类的文本数之比。召回率是分类正确的文本数与分类应有的所有文本数的比率。在所选择对相近类别区分时,同时考虑到领域本体中的概念层次结构取得了比较好的效果,同时也有利于某一类别的细分。
3 结论
在领域本体中的概念之间语义关系数量化的基础上,本文利用领域本体所提供的层次结构特点,提出了根据不同概念抽象程度的量化公式,对类别区分有比较大贡献的对应概念赋予更大权值,提出基于Ontology的分类方法的改进。在类别比较相近情况下有更好的区分能力,同时也有利于某一类别的细分。文本中特征词的权值大小与特征词在文本出现的位置也有关,美国学者P.E Baxendale进行过统计,反映主题的短语85%出现在段首、句首等位置,7%出现在段尾。因而下一步有必要根据特征词在文本出现的位置分别赋予不同权值,进一步挖掘出文本所蕴含的语义信息。
参考文献
[1]凌云,魏贵义,刘军.基于ontology的Web文本分类法[J].情报学报,2006,4.
[2]Huazhen Gu,Kuanjiu Zhou.Text Classification Based on Domain Ontology[J].Journal of Communication and Computer,2006,3(5).
[3]Sabrina Tiun.Rosni Abdullah Tang Enya Kong.Automatic Topic Identification Using Ontology Hierarchy[J].Lecture Notes In ComputerScience,2004.
[4]Mu Hee Song,Soo Yeon Lim,Dong-Jin Kang,et,al.Automatic Classification of Web Pages based on the Concept of Domain Ontology[J].APSEC,2005:645-651.
[5]刘娇蛟,龚丽,李建华.基于本体实现对网页文本的自动主题分类[J].计算机工程,2003,29(11).
[6]战学钢,林鸿飞,姚天顺.中文文献的层次分类方法[J].中文信息学报,1999(6).
五大类实用类文本知识概要 篇2
一、传记
(一)传记的含义
传记是记录人的生活历程和生命轨迹的文体。根据不同的分类标准,传记可分为不同的类别。
从叙述人称看,传记可分为自传和他传,前者是作者自己撰写的,后者是他人撰写的。
根据篇幅的长短,传记可分为大传和小传。
从创作方法看,传记可分为史学性传记和文学性传记。从表达方式看,一般的传记以记叙为主,还有一类传记则记叙与评论各半,叫评传。评传是人物传记夹杂着作者评述的一种带有文学评论色彩的体裁。它由传主、本事、作者的思考与评析三要素构成。“传中有评,评中有传,评传结合”是其特点。“传要真实,评要中的”是评传写作的基本要求。
(二)传记的特征
胡适对传记的写作原则和要求:一是应该做到“纪实传真”。二是要有“写生传神的手笔”。
1.真实性
传记是用来记叙人物生平事迹的文章,真实性是传记的第一特征。我们所说的传记,叙写的是历史或现实中存在的活生生的人,有真名实姓、居住地点、活动范围等。写传记不允许任意虚构。
2.生动性
传记又不同于一般的枯燥的历史记录,除了真实记录外,还必须有感人的力量。传记是写人的,有人的生命、经历、情感在内;而一旦通过作者的选择、剪辑、组接,就倾注了爱憎的情感,需要用艺术的色彩加以表现,以达到传神的目的。
根据课标的要求,阅读传记,要理清作品陈述的基本事实,区分出作者评论的成分,分析作者评论与基本事实之间的关系,能对作者所持的观点提出自己的看法。
(三)传记的表现手法 1.选材的处理——详略得当
传记的选材是与主题密切相关的。对中心有用的,与主题特别密切的材料,是主要内容,则需浓墨重彩地渲染,要详细写;与主题关系不很密切的材料,是次要内容,则轻描淡写,甚至一笔带过。即详写读者陌生的符合主题、突出人物性格的,略写读者熟悉的不符合主题的内容。
2.人物描写方法
传记是记载人物生平或事迹的一类记叙文体,它的表现手法比较接近于小说。它往往是通过对传主的肖像描写、心理描写、行动描写、语言描写、细节描写、侧面描写(间接描写)等来突出表现传主的人物形象和精神世界,使人物形象血肉丰满,栩栩如生,增强文章的感染力。
传记作为写人的艺术,为了渲染人物个性,离不开记叙具有典型意义的事件和最能表达人物个性的细节。不写事件,传记无以表现人物;不写细节,作者无以使人物生动起来。因此阅读传记需要特别关注细节描写。作者通过传主的日常生活细节,折射出传主的思想观点,保持传主基本思想的整体性,各方面多角度地展现出传主的情感个性特征,使得传主的个性丰满而鲜活,使传主的生命历程更富有光彩,还可增强文章的可读性。
另外,还需特别留意:有些侧面描写看似与传主无关,但却对刻画传主有着重要的作用。例如,利用与传主关系密切者的相关资料来突出传主的形象。
3.引用
在传记中,直接采用大量原始材料——引用,可以更好地突出人物的特点,揭示人物的精神面貌,对人物做出客观公正的评价。
引用诗词,可以从侧面烘托和丰富传主的思想精神,使传记显现出一种古朴文雅的风格。
引用故事,可以增强文章的活泼度,使文章更具有可读性。
引用传主在书信、日记中的表白,可以印证作者的观点,也可以使传记具有更为真实感人的力量。
4.语言特色 首先明确传记类别,了解不同类别传记具有的不同特点。在此基础上结合具体文本加以辨别分析。如,自传采用第一人称,语言或幽默调侃或自然亲切,通常以记叙为主,兼有描写抒情。他传采用第三人称,语言或朴实自然或文采斐然。
二、新闻
(一)新闻的定义
新闻的定义众说纷纭,莫衷一是,说法有上百种之多。参考众多说法,总结如下:新闻是书面或口头传播的最近发生或发现的引发公众兴趣的事件。
新闻中所用到的材料大致有三种:一是新闻事实,二是背景材料,三是作者的主观评价。
(二)新闻的分类
新闻有超广义、广义和狭义三种概念。
超广义的新闻是指人与人交往中传播的各种最新信息的综合,比如人们通过电话、信箱、及时通讯工具、信件等传告的信息,街头巷尾的交谈,看到的某则具有新鲜内容的告示、广告等。
广义的新闻是指新闻机构采用一定的传播方式向社会公众发布的消息、通讯、特写等新闻体裁的总称。
狭义的新闻是指消息。
超广义的新闻高考中不会出现,狭义的新闻篇幅短小,可能会在语言运用和表达中有所考查,应该关注的新闻是指广义的新闻,重点研究其中的通讯、特写两种体裁。
(三)新闻的基本特征 1.真实性
真实性是新闻的第一要素,是新闻的生命,不真实的新闻就叫谣言。新闻的真实性要从以下几个方面来衡量:
(1)准确
五要素(时间、地点、人物、事件、原因)必须完全准确真实;对事件的情节描写、数字运用、人物语言以及人物的心理活动、思想变化、感情起伏的介绍也必须准确真实。
(2)全面 对客观事物报道的时候要全面看问题,不能主观片面。(3)深刻
新闻要去粗取精,去伪存真,由此及彼,由表及里,不能只看表面现象,为假象所迷惑。
2.时效性
要及时迅速地传达出来,以求新鲜、新颖、适时。消息的要求最高,通讯次之,特写最弱。
3.受众性
要面对受众,通过公开的传播途径发布出来。(四)新闻的阅读要求
首先,新闻的内涵比较丰富,所以考生必须掌握相关的文体知识。1.消息
(1)概念:消息又称简讯、短讯或快讯。它是新闻报道中最简练、最短小的一种体裁。消息的特点是真、短、快。它一般具有六要素。一条消息一般由标题、导语、主体、背景、结尾五部分组成。其中不可缺少的是标题、导语和主体。
(2)基本特征:用事实说话,及时地报道最新发生的有价值的事实。消息强调及时、快、新、语言简明。
(3)要素:要素又称“五个w”,即:“何时”(when)、“何地”(where)、“何人”(who)、“何事”(what)、“何故”(why)。这五个“w”与记叙文的五要素是完全一致的。
(4)结构:消息的结构形式是多样的,常见的有倒金字塔式、金字塔式、倒金字塔和金字塔结合式、自由式等。
①标题:是消息的眼睛。要在第一时间传达出消息最重要、最吸引人的信息,力求鲜明、概括、准确、生动。形式有三种,就是单行标题、双行标题、三行标题。
完整的消息标题有三行:引题、正题和副题。引题放在正题前,揭示消息的思想意义或交代消息的背景、说明原因、烘托气氛、引出正题;正题概括说明消息的主要事实和思想内容,是标题的核心;副题放在正题后,揭示结果和内容提要,对正题起着补充说明的作用。两行标题的形式有:“正题+副题”、“引题+正题”。拟标题时,标题要注意虚实结合,“实”是指包含有具体新闻事实内容;“虚”是指描绘气氛、揭示意义或点明意图。
一般来说,单行标题必须是实题,双行标题中,必须有一个实题,而“正题+副题”的标题,副题必须是虚题。
②导语:消息的第一句话或第一自然段,用简明生动的文字,写出消息中最核心的信息,鲜明地揭示消息的主题思想。导语通常要包含五个“w”和一个“h”:何时(when)、何地(where)、何人(who)、何事(what)、何故(why)、如何(how)。常见的导语类型有:叙述式、描写式、对比式、评论式、提问式、结论式。
③主体:紧接在导语之后,它对导语作全面的阐述,具体展开事实或进一步突出中心,实事求是地写出导语所概述的内容。
④背景:是指事件的历史背景、周围环境与其他方面的联系等。一般说,它是消息的从属部分。消息背景的种类可分为三大类:对比性背景材料,说明性背景材料,注释性背景材料。
它对于新闻事实的作用主要有以下几点:说明新闻事件的起因;显示或帮助读者理解新闻事件的重要性;突出新闻稿件的新闻价值;表明记者的观点;衬托、深化主题。
⑤结尾:即结语,紧扣主题的抒情议论,起到表现或深化主题的作用,语言较为精练。有小结式、启发式、号召式、分析式、展望式。并不是所有的消息都有背景和结尾。
2.通讯
通讯是比消息更详细、更生动地报道典型人物、典型事件的新闻体裁。从内容上看,通讯侧重于写人,突出人物在事件中的能动作用;从内容上看,通讯对新闻事实作较为详细而完整的报道;从表达方式看,通讯可以采用记叙、描写、抒情、议论、说明等表达方式;从时效看,通讯的采访较为费时费力,写稿的时间要比消息长。好的通讯要涉及到主题、选材、结构、细节描写等。一般通讯可分为:人物通讯、事件通讯等。
主题:准确、鲜明、集中、深刻。
选材:严格、精心挑选能突出主题、具有典型性的材料。结构:较灵活,做到完整、严谨、巧妙、和谐,情节要有些起伏,有点波澜。细节描写:使通讯中的人物“立”起来,感染和打动读者。
人物通讯:以人物为报道对象,着重反映一个人或几个人的思想、言行、事迹,在一个主题贯穿下容纳着相当丰富的人物资料,并以其人物精神面貌感动、教育读者。
事件通讯:以写事为主的通讯。它主要记述事件的发生、发展、结果,交代来龙去脉,介绍具体情况,点明它的典型意义,以体现时代的新气象、新变化。
3.报告文学
报告文学是一种新兴的、具有强烈新闻性,又具有浓郁文学性的独特的文学体裁。报告文学的特点是时代性、新闻性、文学性、说理性。报告文学的分类大体有以下几种:从篇幅上分,有长篇报告文学、中篇报告文学、短篇报告文学、微型报告文学;从表现手法上分,有记录性报告文学、概括性报告文学、报告文学小说;从作品表现的着重点来分,有写人为主的人物报告文学和记事为主的事件报告文学。
人物报告文学:以人物作为重点,展开描述,以人带事,事因人生。以写先进人物和光明面为主,用意在树立榜样,激励斗志,但也有揭露阴暗面,写落后人物、反面人物的。可以分为两种:一是重点突出写一个人的,或是为人物“立传”,写一个人的全貌,表现他的光辉一生,或是写一个人物的片断,或一个侧面,反映他有意义或不寻常的经历;二是写人物“群像”的。
事件报告文学:以事件作为重点,行文中,以事带人,人因事显。以写先进人物的事迹为主,但也不乏暴露反面人物的反面事件的,用意在于突出问题的严重性、危险性,发人深思,促人警醒。可以分为三类:写重大事件的,写生活中有代表性事件的,写社会上、自然界中突发性事件的。
4.特写
特写就是作者借用电影拍摄特写镜头的手法,通过形象描绘来再现现实生活中富有特征的片断,给读者留下鲜明而深刻印象的新闻体裁。
特写一般用于再现重大事件的一个片断或者变化中的一个场景。文学手法运用较多。感情比较充沛,爱憎分明。
三、访谈(一)访谈的概念
访谈是就某个人、某件事、某个特定问题去访问专家或知情者,请他们对提出的问题进行解答,然后运用谈话纪实的方式进行报道的文章。
(二)访谈的三要素
采访对象(专家或知情者)、采访人(记者)和现场。(三)访谈的要求
1.主题:深刻,有针对性、时效性、典型性。2.结构:开头、主体、结尾。
(1)开头:吸引对方,引起对方兴趣,积极进入主题。
(2)主体:要有敏锐的眼光,善于发现新问题、新材料、新亮点,准确判断它们所蕴涵的价值。
(3)结尾:适当的总结,表示对访谈对象的感谢。3.语言:平实,口语化,综合运用多种表达方式。4.态度:抱着尊重、理解、学习的态度与访谈对象交谈。
5.再现访谈对象的话语特点,体现现场感。如《焦点访谈》《艺术人生》《鲁豫有约》等。
6.提问者善于引导,随机应变;访谈对象要积极回应,言之有物。
四、科普文章
1.科普文章的定义
科普文章是介绍、普及科学知识的说明文体。科普文章以知识喻人,知识性是它的主要特点。科普文章采用的主要表达方式是说明。
2.科普文章的特点(1)内容的科学性
科学小品的科学性非常重要,内容必须合乎科学,引用的资料必须可靠,数据必须准确。写科学小品的目的就是向人们普及科学知识,如果介绍的知识不合乎科学,不仅达不到写作目的,还会造成很坏的影响。比如,有科学小品提出“盆花不宜在室内过夜”,理由是植物在夜间要吸入氧气,呼出二氧化碳,在室内过夜,有害人的健康。事实上,每300平方米叶面呼出的二氧化碳才相当于一个人的呼出量。可见,几盆花放在室内过夜,不会影响人的健康。所以,科学小品介绍的知识必须有真凭实据,合乎科学。
(2)文笔的生动性
文笔的生动性是科学小品区别于一般说明文的主要标志。怎样才能使科学小品文的文笔生动呢?
一是要善于记叙和描写。比如《死海不死》中关于一段神话故事就用了记叙的写法,而《奇峰异洞话桂林》就有许多精彩的描写。
二是要善于穿插趣闻。比如《死海不死》中插入一段神话故事,把人在死海中不下沉的情形叙述得形象生动,从侧面说明死海水的浮力大的科学道理。又如在《人类的语言》一文中插入在上小学时大师兄作文中两句话的情景,都使得文笔轻松活泼。
三是要善于运用修辞。因为有些科学知识不太好懂,善于运用比喻的修辞方法,可以使科学原理通俗易懂,便于介绍、普及科学知识。
(3)内容的通俗性
科学小品文不是为专业科研服务的,它以普及科学知识为己任,所以它必须深入浅出、通俗易懂地解释、介绍、表现科学内容。比如《人类的语言》等文章,都具有内容通俗易懂的特点。
3.科普文章的形式
(1)描述式。这类小品文想象丰富,语言优美,既有形象的描写,又有生动的叙述,具有文艺性散文的风格,但是以介绍科学知识为目的。
(2)自述式。自述式就是把所要介绍的科学知识,用第一人称的拟人化的手法,赋予人的思想、感情、语言、动作,让被说明的事物站出来作自我介绍。
(3)故事式。将要介绍的科学知识,编成生动有趣的故事,使人们在读故事或听故事时获得科学知识。它和自述式不同的是,用第三人称;相同的是,大多采用拟人化的手法。
(4)谈话式。谈话式也称对话式,就是以问答、对话的方式进行说明。
五、报告
报告是向上级机关汇报工作、反映情况、提出意见或者建议、答复上级机关的询问时使用的公文。报告的使用范围很广,按照上级部署或工作计划,每完成一项任务,一般都要向上级写报告,反映工作中的基本情况,工作中取得的经验教训,存在的问题以及今后的工作设想等,以取得上级领导部门的指导。如“审计报告”、“评估报告”、“立案报告”、“调查报告”等。高考主要考查的是调查报告。
1.调查报告的定义
调查报告是一种常用的应用文体,是根据特定目的,运用辩证唯物主义观点,对某一客观事物进行调查研究之后写成的书面报告。
2.调查报告的类型
按性质和内容一般可以划分为综合调查报告、典型调查报告和专案调查报告三类。
3.调查报告的文体特点
一般来讲,调查报告的结构,由开头、主体和结尾三部分组成。(1)开头
就调查的一些情况作简要的说明,比如说明调查的目的、对象、经过、时间、方式、方法和结果等。这样做,有利于作者展开和读者理解整个调查报告的内容。还可以在调查报告的开头部分写一个类似于消息的导语一样的文字,提示一下全篇的主要内容,使读者先形成一个总的印象,以便迅速把握全文的中心。
(2)主体
调查报告中关于事件的叙述和议论主要在这部分,是充分表现主题的重要部分。在内容安排上,主要是采取纵式、横式和对比三种结构形式。
①纵式结构
按照调查的顺序、时间的顺序或是根据事件发生的先后过程来写。这种纵式结构比较简单,适合表达线索单
一、内容集中的报告内容。它的特点是内容连接贯通,结构条理清楚。
②横式结构
可以按调查的内容分为几个部分,加以叙述和说明。这种结构比较常见,它的特点是从几个不同的角度、侧面回答问题,论述比较全面、透彻,适合表述问题比较复杂、内容层次多的报告内容。写作时要注意安排好各部分之间的逻辑关系,分清并列、从属、主次关系。
③对比结构 即把两个不同对象加以对比写。从自始至终的对比中让人们认识到不同的思想、不同的做法,会产生不同的结果。结构安排上的对比是为了引起读者思想上的对比,使读者在对比中肯定所是,否定所非。
主体部分不管采取什么样的结构,都应该做到先后有序,主次分明,详略得当,联系紧密,层层深入,以更好地表现主题。
(3)结尾
立足文本特点探寻知识架构 篇3
一、整体观照,序列成体
教材本身有一定的知识序列,教师要首先吃透教材的顶层设计。如许多教师对当下语文苏教版教材的文体知识序列是存有抱怨的,认为这套教材按照主题内容来进行编写,文体意识不够强,甚至认为有些杂乱无章。比如八上《苏州园林》,很多老师把它当作游记散文来教,八下《我们的知识是有限的》,很多老师都把它当作议论文来教,其实这两篇文章都是说明文。
如果我们从整体上观照苏教版教材里的说明文文本,七上第三单元通过《宇宙里有些什么》让学生初步接触说明文这种文体,学生对该文体的认识可能是模糊的,但能感觉到与小学阶段大部分接触的记叙文是有所不同的。七下通过《人民英雄永垂不朽》《巍巍中山陵》《凡尔赛宫》《黄鹤楼》《于园》等说明文来展现建筑艺术的魅力,七上第四单元动物世界又通过《松鼠》《松树金龟子》《国宝——大熊猫》等说明文来介绍各具特色的小动物,并且让学生接触到了生动说明的科学小品,整整两个单元的说明文,教师可以依据文本特点,有序列、有侧重地将说明文对象的特征、说明顺序、说明方法、说明语言等渗透到教学设计中。八上的《苏州园林》与前面三篇游记散文交杂在一起,编者的意图不言而喻,是让我们更好地来区分在同样介绍景物的文章中,游记散文和说明文的不同。游记散文更多的是记录游览过程中的所见所闻,而说明文是突出说明对象的特征,如“苏州园林”是突出“无论站在哪个点上,苏州园林都是一幅完美的图画”这一特征。而且八上第六单元高新科技又是一组说明文,特别是八下的《沙漠里的奇怪现象》《我们的知识是有限的》《叫三声夸克》《宇宙里有些什么》《花儿为什么这样红》这一组说明事理的说明文,很多教师对这一单元的这组文章颇有微词,认为文体不清。其实这一组说明文正是编者的匠心独具所在,由于是说明事理的,所以与介绍建筑、动物等事物性说明文是截然不同的,说明对象一个是物,一个是事理,就说明顺序而言,前者通常采用空间顺序,而后者大多采用的是逻辑顺序,而且由于说明对象是事理,所以内在有着严密的逻辑推理。如《我们的知识是有限的》看似讲道理,是议论文,其实是通过以人类对声音和乐音成因的认识逐步深化发展而又愈感困惑的事实为例,说明我们的知识是有限的这一事理。议论文通常讲事实、摆道理,而这篇文章把人类千百年的认识史浓缩为一个人的故事,虽然人类发现声音的确经历了这样几个阶段,但这个人发现声音的过程显然是虚构的,是明显不符合议论文的文体特征的,所以这不是摆事实,而是生动说明事理的一种方式。苏教版教材由感性到理性、由个别认知到系统学习的教材编排,既符合文体知识序列规律,同时也符合学生的认知规律,而我们教师要有意识地建构微型知识系统,将知识进行有机衔接。
当然不仅仅是文体知识,修辞知识、文学知识等也可通观教材,有机形成微型序列,这样当学生拿到一篇文章后,才能对文体、对写作手法等有一定的敏锐度,阅读文章时才能像庖丁解牛,“批大郤,导大窾”“恢恢乎其于游刃必有余地矣”。这样才能做到教一篇是为了教一类文章,从而达到“教是为了不教”的终极目标。
二、随文而教,“乱”中有序
首先,随文而教要遵循文本的本身特点,如《我们家的男子汉》通过“他对食物的兴趣、他对父亲的崇拜、他对独立的要求、他的眼泪、他面对生活挑战的沉着”这五个小标题来表现小小男孩身上大大的男子汉气概,既有趣,又惹人怜爱。利用小标题来组织全文,是本文的一大写作特色,教师通常会让学生评价或替换标题,此时随文而教一些短语结构等语法知识,那么学生无论评价或替换标题时都会有意识地运用相应的语法,使得改后的短语结构更加匀称,内容表现更严谨。通过对该文本标题的学习,学生既对文本内容有了深入理解,又对偏正短语结构有了一定的认识。因此,教师需充分挖掘文本本身的写作特色,对有必要的语法等知识进行相关教学。
其次,随文而教虽不要求系统集中,但也需循序渐进。如同样是短语结构的学习,《我们家的男子汉》集中在偏正短语的学习,而《美丽的西双版纳》,由“高高望天树、竹楼映蓝天、悠悠野象谷、妩媚傣寨水、笑对生与死”五个小标题架构全文,通过改拟标题,使学生在接触过偏正短语的基础上,进一步学习主谓短语如“竹楼映蓝天”、动宾短语如“笑对生与死”。《我们家的男子汉》在七上,而《美丽的西双版纳》在八上,可见,对于语法知识的学习不需要集中一段时间去系统学习,但教师要有计划地根据文本特点随文而教相关的语法知识。
当然,不仅仅是短语的结构学习,也不仅仅是语法学习,有许多如与教材密切关联的作家作品知识、古代汉语知识等,都需要我们随文而教,也都需要我们根据文本特点,进行整体观照,探寻内在的序列。
三、打破壁垒,贯通“三维”
语文知识像语文学科的骨架,而能力、情感态度价值观等就像语文学科的血肉,它们之间并不存在孰轻孰重的问题,正是由于这三维目标的共同发展,才使得语文素养的提升在学生身上鲜活、灵动、丰富地得以实现。
很多时候,我们教师将知识与能力对立起来,认为知识是“死”的,而把能力看作是“活”的。其实知识与能力就像一张纸的两面,将知识灵活运用到各种语境中去,获取具有生命力的鲜活的知识,打破知识与能力的壁垒,在习得知识的过程中思维积极参与建构,才能提炼知识学习的“理”,从而实现转识成“智”的理想境界。如在教授《木兰诗》时,文章采用大量的铺排、对偶等来表现战前“阿爷无大儿,木兰无长兄”的无奈、四处准备作战工具的紧张忙碌、作战中木兰对家人的思念、战场的惨烈、作战后木兰的淡泊名利以及小儿女的欣喜。修辞手法用来更好地表现气氛的特点、人物的心理、细腻的情感。语言形式与语言内容是有机统一的,有的老师从语言形式入手,着眼战前、战中、战后的三处铺排,来感知文章内容,探知人物心理和人物性格。由文章略写木兰征战沙场,详写战前、战中、战后的儿女情怀来探知木兰渴望和平、愿做普通女子不愿做巾帼英雄的心声,即由文本详略安排入手来走进人物的内心世界,来探知文本真正所表现的主题。有的老师从语言内容入手,由木兰的人物形象分析,由一个女子不得不脱下红装,穿上戎装,最后又穿上女装的心路历程来总结修辞手法的运用。无论是从语言形式走向语言内容,还是从内容归结知识特点,都能让学生在有机的实践活动中习得语言形式的运用,获得分析问题的能力,得到语文素养的提升。
因此,知识是课程的根基,是形成能力和素养的源头,任何时候、任何一门学科教学都离不开知识教学。但是,语文知识教学不是简单追求知识概念的建立,也不要求知识体系的完整,而是需要教师立足教材,形成知识的序列,形成知识的微系统。更重要的是,要更加注重知识的实际运用,将其置于文本特定的情境中,用“活”方法学习“活”知识,引导学生探得语言形式与语言内容的本质联系,从而来学习语言文字的运用。
基于知识树的文本自动分类方法探索 篇4
关键词:文本知识,自动分类,概念,知识树,概念关联
随着科学技术的快速膨胀发展和网络的普及,人们获得的信息正以指数增长,网络信息方便快捷、涉及广泛,人们可以通过网络查询到自己所需的任何资料和信息。但怎样从你所查询的信息中挑选自己所需的就成了问题。如你想在网上查询一个礼物“维尼熊”送给朋友,你或许会用goole进行搜索“维尼熊”;也可能会用淘宝网搜索“维尼熊(Winnie the Pooh)”。如图1所示就会出现这些界面。
可以看出简单搜索是不够的,需要对这些数据进行系统的分类才可方便用户浏览。因此分类在一些知名网站就变得很重要了。现在文本分类技术应用很广泛,像天网马上要推出自动分类网页目录;通过主题分类对期刊文章进行检索;电子邮箱信息过滤等等。
1 文本分类的定义
分类是在已有数据的基础上学会一个分类函数或构造出一个分类模型,即通常所说的分类器。文本分类是处理和组织大规模文本信息的关键,是解决主观搜索、个性化信息检索、搜索引擎的目录导航、信息过滤中相关问题的核心技术.通常由预处理、文本表示、分类方法及测试评价几部分组成[1]。
一个完整的文本分类过程如图2所示,主要包括以下几个部分[2]:
1)预处理:对中文进行分词、词性标注、短语识别、去除停用词、去掉html一些tag标记和稀有词等操作;对英文则要进行词干化、去除停用词和稀有词等。
分词处理就是用分词算法,把文本切分成字、词和短语,对于中文文本的分词,需要进行特殊的处理。目前比较常用的方法有最大匹配法、反向最大匹配法、二次扫描法和联想回溯法等。
2)文本表示:统计词频及文档频数,采用适合的权重计算方式,构建文档集的文档向量矩阵。空间向量模型(SVM)是常用的有效方法之一。
3)约简特征:利用维数约简的方法,从预处理数据中抽取若干有利于分类的特征项(可以是具体的单词、短语,也可以是抽象的语义、概念单元)。
4)训练分类器:选择若干文档集(已知文档类别)构成训练集,通过某种算法对该训练集进行统计、学习,确定学习器的各个参数,最终得到一个自动的文本分类学习器。
常用的分类算法有K-最近邻分类法(KNN)、朴素贝叶斯(Naive Bayes)、决策树(Decision Tree)、神经网络(Neural Net)、Rocchio方法、决策树方法等等。
5)测试评价:根据学习训练阶段得到的分类器,对测试集进行分类;并选择合适的评价指标对分类器的性能作出评价。
2 文本分类的方法
本文主要介绍基于知识树的文本自动分类方法。
和人为分类比,可提出基于知识的文本自动分类原因有:领域知识是手工创建的;文档可通过分类算法来分类的。让知识树代表领域知识。在此文中,认为文件种类是知识结构和语义结构的集成过程。
2.1 系统结构设计与实现
系统结构如图3所示。
2.2 知识树[3]
知识树本质上就是一个层级式知识图,它表达了为实现某一组织目标的所有相关组织知识间的因果关系或从属关系。层级式知识图由于具有对称性、良好图形、连续性等特点,而得到广泛的应用。知识树模型在层级式知识图的基础上拓展了更多的管理功能。
考虑一个为完成某一组织目标的知识构成的层次知识结构。它是若干个关联的知识结点集K,知识结点间的关系集r,构成了一个关系集R。知识结点集K与知识关系集R构成了一个知识树D=(K,R)。如图4所示。为进一步研究知识树,引入下列概念:
父结点:相邻两个知识结点中表示目标知识的上级结点。
子结点:相邻的两个知识结点中,表示达到目标的手段或子目标的下级知识结点。
关系:父结点和子结点关联的方式。r具有两种形式:
联合:子结点是共同完成父结点目标的若干个子目标或子功能。
替换:子结点是实现父结点目标的若干个可相互替代知识方案或手段。
根结点:无父结点的知识结点,它表示组织的目标知识。知识树具有唯一的根结点。
叶结点:无子结点的知识结点。
知识链:从任意一个知识结点到它可达的一个叶结点的结点序列构成该结点的一条知识链。
知识子树:任意一个知识结点所有知识链构成以该结点为根的知识子树,简称子树。
本文将知识结构划分为两部分:概念和概念关系。结点概念是指知识树上结点的概念。概念就是人们获取客观事物或对客观知识的反映得出的结果。概念在知识树是由结点表示的,一般来说,我们阅读文本标题或文本的几行内容时,文本类别进行分类过程时,不需要读完全部,只需凭主观概念去分类。主观概念如字、词语可以和其他的区别开来。世界万物都是有联系的,关系存在于概念之中。一般来说,文本是包含概念信息和概念关联信息的。将概念关系划分为三种:上下义关系、成员关系和同义关系。上下义关系具有遗传性质,即儿子概念可以继承父亲概念的所有特征。在知识树中,符号‘→’表示关系。成员关系也叫整体-部分关系,就是指在整体概念和它的组成部分概念间的成关系,用‘—’表示。
总之,知识树是由有层次性的语义结构组建的,这些不同层次性的概念和关系构建整个背景知识。
2.3 分类算法
将文本内容与获取的知识匹配,然后激活(使得更好理解),最后进行文本分类。虽然文本书写类型多种多样,但在同一个类中还是有相同的词和关联词。当我们将文本分类时,主观词和它们之间的关系就可以决定文本属于某一种类。因此,自动文本分类可以用文本中的主观词和知识树的节点概念的匹配过程来定义,也就是说,可找到节点概念的最大概念去匹配文本信息。
基于知识树的文本分类算法描述如下:
输入:一个原始文本即待分类的文档D;
节点概念的初始化相关系数R0、来自上下义关系的遗传关系系数Rh和来自成员关系的相关系数Rc、最初相关系数R0'、主题联主观种类系数R(Sj).
输出:文档D的主题类别
只考虑较低结点到较高结点的影响。无叶结点概念的相关系数计算如下[4]:
初始化相关系数R0=Ni/M,(Ni≥0,M≥0);其中Ni是在文本中结点概念Sj的个数,M为文本中所有结点概念的个数;
遗传相关系数;其中an为结点概念的权重;子节点与父节点起着同样的作用,所以Rh可表示为,其中Nh为子节点个数(上下义关系);同样Rc可表示为其中NM为子节点个数(成员关系);
对于同义关系,概念等同于知识树的结点概念。概念影响最初相关系数,其中Ni为结点概念Sj的数目,Ns为Sj的同义概念个数。对叶子结点来说,它们的相关系数就是它们的初始相关系数。最后根据概念之间独立性可得出:
对于那些不属于任何类别的文本,结点概念可能就会在文章中出现,但这些结点概念之间却没有关系。为此,设定一些可以去除这些概念的规则去对识别文本类别。规则如下:
结点概念:在该分支上没有其他结点概念的结点概念可去除。
满足以上两个条件,与那些主观结点无关的结点概念Sj就可去除。
3 测试数据和实验结果
用查全率、召回率和F1测试值三个参数来评价文本自动分类的算法,按以下数学公式计算[5]:
测试语料库中的文本来自2005年的《人民日报》选出300篇,根据预定义11种:政治类、军事类、经济类、法律类、文化类、体育类、卫生类、宗教类、工业类、农业类、交通类进行自动本分类。实验结果如表1所示:
从结果可看出,正确率、召回率和F1测试值是很高的,因此基于知识树的文本自动分类方法可行。
4 结束语
本文提出了一种基于知识树的文本分类方法,该算法满足要求也可以应用到实际的分类系统中,知识树有增删节点的良好性能,但是该算法也有不足之处如文本标题和关键字没有处理。在下一步工作中将进行改进。
参考文献
[1]蒋宗礼,徐学可,李帅,文本分类中基于词条聚合的特征抽取[J].哈尔滨工程大学学报,2008(11).
[2]罗远胜.基于PLS的文本分类技术研究[D].江西师范大学,2006.
[3]http://www.shenmeshi.com/Education/Education_20090827155153.html.
[4]张焕哲.基于主题概念树的科技文本分类方法研究和实现[D].华北电力大学,2006.
[5]熊亮.基于概念树的文本自动分类系统的研究与实现[J].计算机工程与应用,2005(30).
[6]周茜,赵明生.中文文本分类中的特征选择研究[J].中文信息学报,2004,18(3):17-23.
[7]刘丽珍,宋瀚涛.文本分类中的特征选取[J].计算机工程,2004,30(4):14-16.
高级秘书办公自动化知识:文本编辑 篇5
在输入文本前选择一种中文输入法,可以首先单击Windows任务栏右端的输入法键盘式图标,然后在输入法列表中选择一种拼音或五笔输入法。
(二)
在文档中移动插入点的方法很多:
(1)如果要在当前屏幕上移动插入点,只需把I形指针指向新位置,然后单击鼠标左键即可。
(2)如果文档很长,需要编辑的文本没有在屏幕上显示出来
(三)选取文本
Word把选定的文本按反白方式显示,即黑底白字而不是标准的白底黑字。
用鼠标选取文本只需把鼠标指针定位于要选定文本块的开始处,按住鼠标左键进行拖动,直到使所需
(四)复制、移动、删除文本
1.
操作步骤是:先选定要复制的文本,然后选择“编辑”菜单中的“复制”命令(或按“Ctrl+C”键)或者单击“彰”工具栏中的“复制”按钮。接下来将插入点移到要粘贴文本的新位置,再选择“编辑”菜单中的“粘贴”命令(或按“Ctrl+v”键),或者单击“常用”工具栏中的“粘贴”按钮即可。
2.
移动文本的操作与复制文本类似:选定要移动的文本后,选择“编辑”菜单中的“剪切”命令(或“Ctrl+X”键)或者单击“常用”工具栏中的“剪切”按钮,此时,选定的文本已从原位置处删除,存放到剪贴板中;在文本将出现的位置处单击以放置入点;选择“粘贴”命令。
3.怎样删除文本?
欲删除文本块,只需选定文本块后,按“Del”键即可。要注意的是,按“Del”键会删除插入点右侧的文本,按“Backspace”键会删除插入点左侧的文本。
(五)撤销与恢复操作
在文档的编辑过程中,如果不小心删除了一些文字,Word允许把刚删除的内容恢复过来;如果又想删除该文字,则可以选择“恢复”命令。
(六)插入与改写文本
Worde启动时默认方式为插入方式,在这种方式下,输入新的文本后,插入点后的文本自动向右移动。在改写状态下,新输入的文本会覆盖自找文本。
(七)查找和替换
查找和替换功能,使用户能够迅速找出指定的文本、格式和样式等,然后可以用新的文本、格式或样式替换旧的。
1.
其步骤为:
(1)选择“编辑”菜单中的“查找”命令,出现“查找和替换”对话框,选中“查找”选项卡。
(2)在“查找内容”框中输入要查找的文本。单击“高级”按钮,可以打开一个能设置各种查找条件的详细对话框。
(3)单击“查找下一处”按钮开始查找。
(4)
(5)
2.
可按以下步骤进行操作:
(1)选择“编辑”菜单中的“替换”命令,出现“查找和替换”对话框,选定“替换”选项卡。
(2)在“查找内容”文本框中输入查找的文本或格式。
(3)在“替换为”文本框中输入要替换的文本或格式。
(4)单击“查找下一处”按钮,开始查找。当找到匹配的文本后,会在文档中反白显示该文本。
此时,用户可以根据需要进行选择:
(1)如果不想替换当前的内容,可以单击“查找下一处”按钮,继续进行查找。
(2)如果想替换当前查找的内容,可以单击“替换”按钮,替换完后,继续进行查找。
文本知识 篇6
一、现代信息教育技术背景下语文新教学模式
随着信息技术的飞速发展,语文教学领域中广泛应用到现代教育技术。先进的信息技术,不但对传统教学手段的局限性进行了充分的突破,同时对语文课堂教学结构进行了最大程度的优化,让学生的语文知识面进行了扩展,从而有效提高了语文课堂教学策略,让学生的语文素养得到了充分的发展。
如在学习《翠鸟》这篇课文的过程中,我从学生的年龄特点出发,运用现代教育技术,精心设计了精彩绝伦的多媒体课件。在表现翠鸟身上羽毛颜色的时候,课文中出现了三个词语,分别是“淡绿色”“深绿色”“翠绿色”。如果仅仅从字面上来理解这三个词语,就算教师讲解得如何丰富,学生也无法理解这三个词语所指向颜色的区别。但是,教师如果能够借助于多媒体展示这三种颜色的羽毛,然后通过这个具体的物象来告知学生什么颜色是淡绿色,什么颜色是深绿色,什么颜色是翠绿色,就能加深学生的理解。
二、挖掘文本内涵,提高学生语文素养
小学语文课本学习中,会出现很多的空白之处,当学生在阅读过程中,会借助于自己的想象对这些空白进行大胆而合理的补充,从而对作品的内容进行进一步的充实。通过丰富的想象力,可以扩展作品的内涵,让学生的思想得到相应的发展。因此在小学语文教学过程中,教师要充分利用文学作品为我们留下的空白,深层次挖掘其中的积极作用,有效提高学生的语文素养。
如在对《十六年前的回忆》这篇课文进行学习时,我引导学生对文本内容进行粗读、细读和精读,让学生自己探寻文本内容中体现出来的问题。在反复阅读之后,有学生产生疑问:“父亲每天夜里回来得很晚,每天早晨不知什么时候又出去了。父亲到底在忙什么呢?”而有的学生在阅读中产生疑问:“为什么父亲没有戴眼镜,而且头发乱蓬蓬的?”等等。将这些问题弄清之后,就能对理解文章深刻的思想含义。所以,教师要充分利用这些“空白”之处,同时要将这些“空白”之处进行充分的理解,然后找到填补“空白”的方法。
三、强化训练,引导学生进行独特体验
在小学语文阅读教学过程中,要注重体验的独特作用。语文课程有着丰富的人文内涵,所以在语文教学中,要激发学生积极主动的思维能力,对课文进行深层次的理解和体验,感悟文本内容的优美之处,让学生受到文本内容情感的熏陶,享受到文本审美的乐趣,从而对文本优美之处进行深层次体验。培养学生的语文素养,不管是智力开发、能力培养还是进行情感培育,都没有一个固定的模式,如果只是靠单纯的传授是不能获得相应效果的。教师要结合学生学习实际,深层次挖掘文本内容的魅力之处,从而培养学生良好的审美情感。
如在学习《惊弓之鸟》这篇文章之后,我对学生出示一个问题:“更羸为什么不用箭直接将天上的大雁射杀下来呢?”学生学习完这篇文章之后都能指出这是由于他善于观察、分析和判断事物。但是,有一个学生站起来说:“我认为更羸这种做法是不对的,大雁属于保护动物,他不应该伤害这只受伤的大雁。”这位学生的回答出乎我的意料,但是我认为他的思维能力是独特的,因此对他的回答中体现出来的环保意识进行了表扬。
文本知识 篇7
根据《普通高中课程标准(实验)》,英语教学的总目标是使学生在义务教育阶段英语学习的基础上,进一步明确英语学习的目的,发展自主学习和合作学习的能力,形成有效的学习策略,培养学生的综合语言运用能力。综合语言运用能力的形成建立在语言技能、语言知识、情感态度、学习策略和文化意识等素养的整体发展的基础上。只有在英语教学中扎实地落实语言知识,才能确保学生阅读能力的提高,及语言技能的培养,最终发展学生的综合语言运用能力。文本一词,源于拉丁文的texere,本意是波动、联结、交织,并因此衍生了构建、构成、建造等意义。在Longman ContemporaryEnglish Dictionary中,对于文本的定义是:A text is a book orother piece of writing that is connected with learning or intendedfor study.因此,在英语教学中,文本应该是指用于英语教学的篇章内容。那么,什么是解读?《现代汉语规范词典》的定义是“通过分析来理解。”所以,文本解读在英语教学中可以理解为教师对英语教学文章的分析、理解,进而产生感受、体验和领悟并形成对文本材料的价值取向的一个过程。英语阅读文本是由词汇、句子和句群组成的。学生通过阅读课的学习能获取文本信息,把握文本内涵,掌握相关的语言知识,因此教师要深入挖掘教材,合理利用并发挥教材的最大价值,对教材所选文章进行解读与分析,再将其中的语言知识合理设计在阅读教学中,展开教师、学生、文本之间的充分对话,才能有效地实现文本的教育价值,提高英语课堂教学的效率。
二、阅读教学现状分析
高中英语教材中阅读量大、词汇量大,教师要在阅读课中既要让学生学习语言知识,又要提高学生用英语获取信息、运用信息、处理信息的能力和用英语分析、解决问题的能力并不容易。因此,在教学中,教师若没有对教材文本进行充分的解读,那么文本就很容易会被当做语言知识的堆砌,而无法充分发挥其蕴含的丰富内涵。在目前的阅读课教学中,很多教师对于语言知识的处理往往采取阅读课前无语境的词汇教学或阅读课后单独处理词汇、句法的教学。长此以往,学生对文本的理解便容易支离分散,难以将所学的语言知识与阅读材料融为一体,学以致用。
三、将语言知识渗透于文本解读的具体策略
1.立足篇章结构,强化功能表达。人教版的高中英语教材体裁多样,不同体裁的文本有不同的篇章结构。分析并理解篇章结构不仅有助于培养学生通览全篇的能力,更有助于学生领会作者写作时的情感,意图和目的。因此对文本篇章结构的分析与理解是考察学生语篇阅读能力的一个重要标志。在课堂阅读教学中,教师要指导学生找topic sentence,也可以引导学生通过找衔接词的方式来理清篇章结构。只有让学生自己学会分析篇章结构,才能有效促使其对语言知识中功能意念的表达。
笔者以Book 7 Unit 1“Marty’s Story”为例,通过对课文文本第二段中句与句之间关系的解读,使学生了解该段落的时间顺序结构,并领会其中until对于时间表达的用法,引导学生对篇章有整体性的概念。
设计说明:学生在阅读中遇到until引导的句子时总是机械地将until翻译成“直到”。在这样的情况下,当学生遇到较难的篇章时,对于该词的理解便成了难点,这也就直接影响了学生阅读能力的提高。笔者从该段落前后句衔接关系入手,在分析文本结构的基础上,尤其是对于used to的解读,文章有两个句子“I used to climb trees ...In fact,I usedto dream about...”帮助学生理解until的含义。再以朗文当代英语词典中的释义对此进行巩固。同时也复习了then,in theend,after all that等表示时间的衔接词,强化学生理解时间顺序词在篇章结构中的表达。
2.精读文本内容,深化词义理解。从近几年的高考试卷中,我们可以发现高考越来越重视词义辨析。而如何才能让学生通过阅读课来理解词汇所包含的不同含义呢?首先,教师应该从语言角度深入解读文本,根据自身对于文本的挖掘,引导学生精读文本内容,感受文本用词的目的,以此达到学生对词义的深度理解。
笔者以Book 4 Unit 2“Chemical Or Organic Farming”为例,通过对文章第一段的文本进行解读,帮助学生在精读内容的基础上,切实掌握词义辨析重点词common的用法。
设计说明:在阅读课中,教师要让学生不仅见到森林更要见到树木。语境的支撑可以强化学生对单词的理解,达到语言教学的有效性,也有助于培养学生对上下文进行推导的能力。在该教学示例中,笔者通过引导学生对文章第一段的精读,帮助学生既理清了段落结构--- 段落第一句为主题句,二三两句是supporting details,更在结构的分析中,强调了“long-term use”的意思,学会了常用词common所包含的两层含义---经常性且大众化,有效地促进了语言知识与篇章结构的融合。
3.依托文本语境,落实语法项目。语言知识的教学不仅要涵盖词汇及功能意念,更要有多样的语法项目。根据课程标准的要求,高中阶段的语法教学,应从语言运用的角度出发,把语言的形式、意义和用法有机地结合起来。教师可以利用文本所提供的语境,分析语法结构在其中的用法;亦可以利用文本创设新的语境,让学生在阅读文本的基础上操练该语法结构。
笔者以Book 5 Unit 2“Sightseeing in London”第四段为例,让学生在阅读文本的过程中理解should在该语境中的意思,同时关注虚拟语气句型。
设计说明:在这个示例中,笔者从帮助学生在语境中以推理思维来理解should的意思及用法,提示Karl Marxdeveloped Communism,然而London是一个Capitalist city,以推断出should为“竟然”的意思,并在文本信息基础上予以简单操练,同时巩固对句型“it is/was/seems/seemed strangethat ...sb.(should) do”的掌握。
四、结束语
文本知识 篇8
能够把输入的文本 (text) 转换成语音 (speech) 信号的语音合成 (speech synthesis) 系统也叫文语转换 (text-to-speech) 系统。现在, 基于大规模语音数据库的波形拼接合成技术已经很成熟。由于语音基元选自真人语音数据库, 优秀合成系统合成语音的可懂度 (intelligibility) 和自然度 (naturalness) 能达到实用的要求。语音合成技术已经进入广泛应用阶段。排队叫号系统、语音导航、语音播报、听网页、听书和有声校对都在不同程度上使用着语音合成技术。在大规模动态信息文语转换和智能语音播报领域, 语音合成技术已经显现出明显的优势。但是要将语音合成技术用于正规的英语多媒体教学和训练, 必须解决偶尔出现的发音错误问题。英语和汉语在语音合成过程中产生的发音错误和更正方法有相似之处, 但也有不小的差异。本文专门研究矫正英语合成语音错误所需的英语文本分析和处理知识库的构建及扩充方法。
1 前端文本分析和处理的任务
语音合成系统需要在自然语言处理 (NLP) 技术的支持下进行语言学分析和处理, 然后在数字信号处理 (DSP) 技术的支持下完成语音合成任务[1]。语音合成系统的前端分析包括文本分析 (text analysis) , 语音分析 (phonetic analysis) 和韵律分析 (prosodic analysis) [2]。前端分析的任务是判断输入文本中的文字发什么音, 如何发音。
前端文本分析主要包括文本结构分析 (document structure detection) , 文本归一化 (text normalization) 和语言学分析 (linguistic analysis) [2]。合成系统通过分析输入文本的结构确定段落和句子的边界。如果发现文本中含有语音合成标记语言标记 (speech synthesis markup tags) , 就对标记进行解释 (text-markup interpretation) 。文本归一化又称作文本正则化或文本标准化[3,4]。英语的文本归一化有三个任务:词例还原 (tokenization) ;非标准词的处理 (normalization of non-standard words) ;同形异义词排歧 (homograph disambiguation) [5]。非标准词是指数字、符号和缩写词等书写形式[6,7]。合成系统根据规则或统计分析把文本中的非标准词扩展或转换成相应英语单词的完整拼写形式。语言学分析帮助系统对文本进行正确的理解和判断, 涉及句法, 语义和语音三个层面。
前端文本处理的任务是把输入的文本转换成符号化的发音描述:发什么音, 如何发音[8]。这些参数符号或代码串用于下一个环节的语音参数处理模块[9], 为后端语音合成提供必要的信息。
前端文本分析和处理实际上是一系列的分析、判断、标注和转换过程。这个过程需要规则词典、例外规则词典、语言知识库和统计算法的支持。前端文本分析和处理是语音合成的必要步骤, 其结果直接影响合成语音的质量。
2 超前端文本分析及处理
2.1 必要性和可行性
虽然语音合成系统内置了大量规则或语言学知识, 但是内置的知识库不可能囊括所有的规则和例外规则。语言知识暗礁不可避免。随着未登录词和新词的出现, 知识库也需要不断更新。因此, 前端文本分析和处理不足以解决所有问题。排歧处理有时需要人工干预。输入的文本必须在前端文本分析和处理之前进行转换调整或标注才能避免出现发音错误。主要涉及下列四个方面:
首先是符号、数字和日期的读音方式。例如:在英语网址中的“/”读作slash, 这可以根据语境判断出来。但是, 3/10可能是日期March (the) tenth, 也有可能是日期October (the) third, 还可能是分数three-tenths。在有些情况下“/”起的是分隔符的作用, 前后项是选择关系, 需要把“/”读成or。此类自动判断的成功率不是百分之百。
第二, 有些缩略词扩展成哪种拼写形式需要人工辅助判断。例如:app.这个缩写词的扩展可能性至少有九种 (apparatus;apparent;appendix;applied;appoint;appointed;apprentice;approved;approximate) , 自动判断有难度。还有个缩写词app是由application (计算机应用程序;应用软件) 缩略而成的, 现在人们谈论手机应用软件经常用到它;app应该读成/?p/, 但是也有人把app读成A-P-P。在介绍app这个词的发音时, 两种发音都会用到。这需要根据语境指定发音方式。首字母缩略词的读音常常需要判断, 要确定是按缩略拼写形式整体拼读, 还是按字母逐个读。例如:US$中的US不能按代词us的读音读, 应按字母逐个读。
第三, 虽然优秀的合成系统对同形异义词的排歧处理正确率很高, 但并不总是准确的。例如:present用作动词时的读音是/pri'zent/, 但是系统偶尔有可能把它读成/'preznt/。
第四, 真实文本中经常含有合成系统的未登录词, 其中的专有名词 (人名、地名和机构名称等) 出现频率极高。有些人名, 尤其是非英语国家的人名发音特殊。汉语姓名通常是用汉语拼音译成英语, 其中有些在合成语音时产生发音错误。例如:按照汉语拼音把宋朝杨家将杨继业的夫人佘赛花和传说中的仙女何仙姑的名字译成英语分别是She Saihua和He Xiangu, 这里的She和He显然不是英语中的第三人称代词“她”和“他”。译文中的She和He需要分别转换成Sheh和Ho。地名的发音, 尤其是外来词, 有可能不符合读音规则。例如:法国南部城市尼斯 (Nice) 是地中海沿岸的一个旅游城市。它的发音与形容词nice的发音是不同的。在Nice is a nice place (尼斯是个好地方) .这个句子中, 第四个词nice读作/naIs/, 而第一个词Nice应读成/nIIs/。
合成系统语音库的词库可以维护, 但内置功能使用不太方便。现在的语音合成系统在一定程度上支持用语音合成标记语言对输入的文本进行标注。使用语音合成标记语言不仅能实现多种精确控制 (例如:设定朗读角色, 朗读速度, 停顿时间等) , 还能指定单词或字符串的发音。例如:根据语境可以用<PartOfSp Part="Verb">present</PartOfSp>指定动词present的发音为/pri'zent/。进行标注和转换的前提是用户已经有明确的控制目标和转换方案。超前端文本分析有助于找出系统前端不能正确分析和处理的词或符号, 以便提前进行相应的处理, 从而避免出现发音错误。
2.2 文本分析方法
超前端文本分析最普通的方法是把输入文本的合成语音从头到尾审听一遍, 发现有发音错误的词或符号就在文本中进行转换调整。这种方法有下列弊端:第一, 必须从头到尾听一遍才能发现错误;第二, 文本中的高频词多次出现, 但有可能从不发生读音错误;第三, 同样的错误, 在新文本中仍需执行同样的步骤进行查找。显然这种方法不仅耗时, 效率还低。
采用基于词汇知识库自动文本分析的方法可以大幅提高效率。方法是自动生成词表, 然后检索知识库, 对词表中的单词进行筛选和分类。步骤如下:
(1) 进行拼写检查, 更正输入时产生的或文本中原有的拼写错误。如果输入文本没有拼写错误, 可跳过这一步。
(2) 自动生成无重复项的单词列表。
(3) 检索黑名单, 查找是否有可能产生发音错误的词。
(4) 检索白名单, 排除已知不产生发音错误的单词。
(5) 审听剩下的单词, 判断哪些词不需要处理 (如果是同形异义词, 要结合单词所在的语境审听读音) , 哪些词需要转换。为需要转换的原单词或字符串添加相应的转换内容。然后把不需要处理的稳定条目追加保存到白名单;需要转换的条目存入转换规则库。
有了词汇知识库, 就能在计算机的辅助下进行筛选和分析, 并根据知识库中的分类词库和规则库进行半自动转换处理。
2.3 知识库的构建
2.3.1 知识库的构成
超前端文本分析词汇知识库包括三种分库:由不产生读音错误的单词构成的白名单词库, 由易错词单词构成的黑名单词库和转换规则词典。
2.3.2 知识库分库的构建
选取英国国家语料库 (BNC) 词频表中的前8000个高频词, 然后逐一审核。删除其中的单个字母, 阿拉伯数字, 罗马数字, 符号和同形异义词。把不发生读音错误的单词保存为白名单基础词库;把有可能造成合成语音错误的单词存入黑名单基础词库。把目前掌握的需要转换的典型条目存入转换规则基础词典。
为了便于知识库的维护, 除了基础库, 还要建三个相应的扩展库:白名单扩展词库;黑名单扩展词库和转换规则扩展词典。这三个扩展库用于分类保存将来在超前端文本分析中发现的新条目或未登录词。
2.3.3 文本分析和知识库构建模块的界面
文本分析和知识库构建模块的界面按功能分为四个区: (1) 文本输入和查询区; (2) 自动分析统计结果显示区; (3) 转换规则修改区 (左侧列表框中是自动分析到的有可能出现发音错误的词语列表) ; (4) 转换规则添加区 (左侧列表框中是自动分析到的未登录词, 数字和符号) 。点击列表框中的项目时自动将原字符串添加到转换规则修改区或添加区。根据分区特点设置“分析;查找;试听;添加;保存;修改;删除”这七种命令按钮。用复选框选择点击列表框中的项目时是否自动播放合成语音。由于添加转换规则需要用到音素代码、字母组合和合成语音标注标记, 所以用选项卡控件将所需标记分类显示。选项卡设置了五种选项:音标标注代码;字母组合标注代码;符号读音参考;异重音控制参考;常用控制标记参考。界面的详细布局如图1所示。
2.3.4 转换规则词典数据的组织方法
为提高检索速度, 将转换规则基础库和扩展库中的所有原字串与其相应的新字串建立关联关系后按二维词典数据结构检索、保存和调用。
在Visual Basic 6.0编程环境下可以使用Dictionary Object (词典对象) 。Dictionary对象用于存储数据的索引项 (Key) 和条目内容项 (Item) ;它的优点是内部提供了快速访问机制, 可以通过Key像查字典那样直接检索到关联的Item项。Key通常用字符串或整数, 但也可以是除数组外的任何类型;Item以数组方式存储, 可以是任何形式的数据。Key与Item一一对应并且Key不能重复。Dictionary对象是动态的, 不必声明所含条目的数量。在数据存储和检索功能上, Dictionary Object与Collection Object (集合对象) 类似, 但比集合对象更灵活、更实用[10]。
2.3.5 部分代码分析
按需求, 要实现下列七种主要功能:分析;查找;试听;添加;保存;修改;删除。由于论文篇幅所限, 下面只分析向转换规则词典添加条目的代码:
3 知识库的应用效果
从中国外交部官方网站随机选择了五篇讲话稿的英语文稿作为输入文本对知识库的应用效果进行检测。测试环境为Windows XP操作系统+IVONA Text-To-Speech语音合成系统 (语音引擎) 。语音库选用的是IVONA英音角色Brian和美音角色Eric。结果显示, 经超前端自动文本分析后, 所选五篇文稿的审听工作量都不到审听全文工作量的15%。需要审听的既有同形异义词, 也有数字和符号, 但更多的是未登录词。例如:全国政协主席贾庆林于2013年2月6日在马来西亚华侨华人举行的公宴大会上讲话的英语文稿 (Speech at the Open Dinner Hosted by Chinese Living in Malaysia) 中的形符总数为1063个 (部分符号不计数) , 经超前端文本分析后, 需审听的形符数降为143个, 审听工作量缩减为原工作量的13.5%。绝大多数专有名词 (例如:Malaysia-China, Kuala Lumpur, Malaysia, Malaysian, Confucius, Malac-ca) 是未登录词, 但它们的读音是正确的。经人工辅助判断, 确认共有八处需要处理: (1) Chinese navigator Zheng He of the Ming Dynasty这个短语中的人名Zheng He (郑和) 的发音不正确。转换成Jheng Ho, 可合成出近似的读音。 (2) China will prove a bigger market and present more opportunities to the neighboring countries.中的present是动词, 但读成了名词的发音。用<PartOfSp Part="Verb">present</PartOfSp>标注即可更正。 (3) US$出现了六次 (处) , 都需要转换调整。例如:Over the past 10 years, the trade between China and its neighbours has grown from US$170 billion to US$1 trillion.这句中的US$170 billion to US$1trillion需要调整成170 billion U-S dollars to 1 trillion U-S dollars才行。其它样本的文本分析结果与此类似, 但有的含有首字母缩略词, 需要转换处理。例如:the UN MDGs和the MDGs中的MDGs需要扩展为Millennium Development Goals (联合国千年发展目标) ;IT application中的IT指的是Information Technology (信息技术) , 需要指定读音为I-T, 而不能用代词it的读音。
可见, 超前端自动文本分析有助于发现有可能产生发音错误的单词或符号, 并可以大幅度提高效率。初始知识库能覆盖到输入文本形符总数的85%左右。随着使用过程中知识库的扩充, 覆盖率还会上升。转换规则库的扩充和应用能够提升超前端文本处理的效率。
4 结论
英语语音合成系统超前端文本分析知识库的构建和扩充方法是可行的。在词汇知识库的支持下, 超前端自动文本分析能大幅降低审听合成语音的工作量, 辅助使用者发现输入文本中产生发音错误的词或符号。这些词或符号经扩展、转换或标注处理后可以避免出现发音错误。随着转换规则库内容的扩充, 处理的效率能够继续提升。因此, 超前端文本分析和处理可使具有优质语音合成功能的软件达到英语教学和训练的要求, 从而丰富多媒体教学手段。
参考文献
[1]DUTOIT T, STYLIANOU Y.The Oxford Handbook of Computational Linguistics[M].Oxford:Oxford University Press, 2003:323-326.
[2]DORF R C.Circuits, Signals, and Speech and Image Processing[M].3rd ed.Roca Baton, FL:CRC Press, 2006.
[3]贾玉祥, 黄德智, 刘武, 等.中文语音合成中的文本正则化研究[J].中文信息学报, 2008, 22 (5) :46-50.
[4]陈志刚, 胡国平, 王熙法.中文语音合成系统中的文本标准化方法[J].中文信息学报, 2003 (4) :45-51.
[5]冯志伟.语音合成中的文本归一化问题[J].北华大学学报 (社会科学版) , 2010 (2) :41-49.
[6]SPROAT R, BLACK A, CHEN S, et al.Normalization of Non-Standard Words[J].Computer Speech and Language, 2001, 15 (3) :287-333.
[7]REICHELUD, PFITZINGERHR.Text Preprocessing for Speech Synthesis[C/OL].InProc.TC-Star Speech to Speech Translation Workshop (2006-06-19) .http://www.phonetik.uni-muenchen.de/~reichelu/.
[8]朱维彬.语音合成中的语言学计算模型:现状及展望[J].当代语言学, 2009 (02) :159-166.
[9]魏茂盛, 章森.汉语语音合成中文本处理的几个问题[J].山东建材学院学报, 1999 (3) :73-75.
文本知识 篇9
纵观当今的语文课堂,我们很容易发现课堂教学设计基本是如此流程,即文章相关知识(主要指向作家、作品常识),文章内容(主要指向文章表达的情感、思想),文章形式与风格(主要指向写作技巧:运思、取材、结章、修辞)。
我们多次细心听课之后,也很容易发现,语文教师的话语体系有雷同之嫌。如批判了什么、揭露了什么,如语言独特、结构精巧、思想深邃,如崇高品德、伟大人格、纯洁心灵、诗意人生,如自然美、社会美、人性美……
这样的教学设计,如此的话语体系,其实折射出我们语文教师长期在“共性知识”圈内徘徊的问题。如“表达了对……的赞美”这一句式,可套在《金岳霖先生》上,说“文章表达了对金岳霖先生的赞美”;可套在《品质》上,说“文章表达了对哥斯拉兄弟品质的赞美”;还可套在《廉颇蔺相如列传》上,说“文章表达了对蔺相如机智勇敢、深明大义的赞美”。很显然,“表达了对……的赞美”所表述的内容,是许多写人类文章的共性,即使是小学生,凭直感,也可用这样的句式将任何一篇写人的文章内容概括出来。解决这样的问题根本不需要动脑筋,但许多语文课堂却常常停留在这些概括上,而这些概括是许多文本的“共性”特征。
不是说这类“共性知识”不能讲,而是说如果文本解读仅停留在这一层面,时间长了,必遭学生厌弃,同时也丢失了文本解读在语文教育中应承担的其他意义。尤其是如果长期停留在空泛概念的搬弄上,而不真正进入文本去发现文本的独特性,课堂就会少很多新奇的意味,不能引起学生新鲜而真切的感受,反而使学生觉得文本就是那些“套语滥调”,贴上标签,自己就读懂了。
因此,如何走出文本解读的“共性知识”圈,应当是当前语文课堂文本解读亟待解决的一个重要问题。笔者以为,教师应该立足语言,真诚阅读,引导学生真正走进文本,沿着作者思路走一遭,探寻作者心灵密码,发现文本真实意图进而培养学生的“文化表现力”,进而丰盈学生的生命知识。
为此,笔者将《金岳霖先生》的两个教学设计进行对比,设计思路分别是“围绕‘共性知识’教学的教学设计”与“‘探寻作家的心灵密码’和培养学生的‘文化表现力’相结合的教学设计”。后者不仅能够完全涵盖前者的教学内容与教学目标,而且在课堂新鲜感、语言敏感点、情感共鸣度、思想深刻性、文化积累量、思维锤炼力等方面,都能达到比前者更好的效果。
二、基于“共性知识”教学的教学设计
教学步骤:
(一)导入课文
(二)作者介绍
(预设目的:掌握文学常识,知人论世。)
(三)在学课文之前,先扫清字词障碍
(预设目的:自主学习,掌握生字词。)
(四)文本研习
1.这是一篇回忆性散文,第一段总领全文,其中有个句子是全文的核心句,这核心句中有个词是全文的文眼,请读第一段找出来。
(预设目的:试图提纲挈领,进入文本。)
2.金岳霖先生是如何有趣的呢?请同学们快速浏览课文,找出体现先生有趣之处。
(预设目的:培养学生的概括总结能力。)
3.“有趣”是金先生的主要特色,在其身上,还有重情的一面,试作分析。
(预设目的:培养学生的概括与筛选能力,力求全面。)
4.通过以上有关金岳霖先生行事的描写,表现了人物怎样的性格特点?
(预设目的:感悟人物个性并准确概括。)
5.结合相关语段,讨论本文的语言呈现什么特色。
(预设目的:体会作者冲淡平实的语言风格。)
6.探讨文章主旨。
(预设目的:回顾课本,把握文章主旨。)
7.作业:写一位曾经生活在你周围而且给你留下深刻印象的人。要求有概括,有细节。
(预设目的:学会从细节着手去描写刻画人物,凸显人物形象。)
这是一次公开课教学设计的实录,它(在实际课堂中有些变体)适应于所有类似文章。对高中学生来讲,除了作者介绍稍有新鲜感,其他基本是“共性知识”,是无数次反复之后的又一次反复,缺乏新鲜感。问题的设置浅表,教学的环节松散,这样的课堂无法在学生的思维深处掀起风暴,也不能培养学生的语感,更不能落实语文教育的“情感、态度与价值观”目标。这样设计的课,没有厚度,一节课基本都在平面滑行,久而久之,定会害了学生的语文阅读兴趣。高中起始年级如果忽视学生的智力与心灵来设计语文课堂,这会让学生又一次误会高中语文,认为高中语文就是如此无趣、无力。
三、基于将“探寻作家的心灵密码”和培养学生的“文化表现力”相结合的教学设计
教学步骤:
(一)预习:了解汪曾祺创作此文的背景及其文学创作特征
(预设目的:让学生对汪曾祺作为一个独特的文化生命体有一个整体的感知。这一设计涵盖了“基于‘共性知识’的教学设计”的第二步,但指向性更明确,且隐含归纳思维的训练。)
(二)课堂教学
1.读文章的第一段和最后两段,在文末作者写了这样一句话,我对金岳霖先生所知甚少,那么在所知甚少的回忆中,你能读出金先生的什么呢?请快速浏览文本,结合文本,完成这个填空:
从______中我读出了金岳霖的______。
(预设目的:①引导学生从文本中探寻作家心灵密码,通过触摸具体的语言文字触摸作者的心灵。②不管读出金岳霖先生的什么特质,学生要有文本语言支撑,还要有自己的独特见解与概括,这是将作者心灵、作品表现的心灵与学生心灵贯通的一种方法。③教师可以及时点拨,引导学生有感情地朗读,将学生慢慢地引向对“金岳霖先生”的立体把握,从而整体地理解文本、理解作家。这一设计涵盖了“基于‘共性知识’的教学设计”“文本研习”的内容,但其意义远超过第一种设计。)
2.汪曾祺曾经在他的一本书的《自序》中写道:“我的散文大都是记叙文……我很少写纯粹的抒情散文。我觉得散文的感情要适当克制。”所以,这些朴实的文字背后,一定还有你还没有读出的金岳霖先生的某些情感、某些性格,或者说作者的某些思想。一起来读一读第二自然段中关于他外貌举止描写的若干句子,你还能读出金岳霖先生的什么?
(预设目的:在第一问题的基础上,学生是有一定的感受,但这种感受有可能是浅表的。再一次重申第一个问题,看起来重复,其实是引导学生重视语言,深读文字,通过这些“朴素简单”的语言文字向更深处漫溯,将问题思考得充分,解决得充足。这样,学生的思维也会走向深入,也能感受到作家语言的朴实风格。)
3.文章最后两段说:“我对金先生所知甚少。希望熟知金先生的人把金先生好好写一写。”“联大的许多教授都应该有人好好地写一写。”
A.请你揣摩汪曾祺先生的心声,读出这两个句子蕴含的情感;
B.请你从作者的角度来思考,为什么要“好好写一写金先生”“好好写一写联大的许多教授”。
前面通过朗读文本,找出相关的细节,学生基本可以慢慢感受到金先生的有趣,并且意识到怪异的背后是一种孤独,是一种真纯。学生能够慢慢地理解“金岳霖先生”其实是一个群体形象,是一个时代的文化符号。“为什么要好好写”这一问是引导学生跳出文本,关注作者的写作意图,这是文本意义的追问,也是努力接近作者的心灵真实,体味作者的文化心灵之密码,亦是学习文本的价值体现。
C.通读全文,找出并朗读文中与金岳霖先生一起出现的那些教授们的细节和介绍王浩的细节,说说写他们这些人是为什么?
(预设目的:表面看只是抓住一些细节语言的来培养学生的语言敏感力,深层次却是加深与文本生命的整体性对话,教授们和王浩等人的交代,是西南联大整体风貌的回忆,是西南联大文化精神的隐形交代。这些语句在很大程度上表现了汪曾祺个体生命的真实内心,是解开汪曾祺真实内心的密码。学生深入字句后一定会有更多的“恍然大悟”,在对昔日联大文化的理解的同时,也厚实了自己的文化认识。)
4.金岳霖,今天站在我们面前的绝不仅仅是那个令人哑然失笑又觉得完全可爱的纯粹天性的老头形象,更有他值得我们尊重的更多的东西,而汪曾祺平淡的文字背后,一定也有我们可以反复咀嚼的情感。请大家动手写出你对作者的心灵解码。
(预设目的:立足文本,感受金岳霖这个大写的人的丰富情感,再次透过金岳霖先生的背影追慕遥远的西南联大精神;形成文字,在作者的心灵密码中掬一把美丽,丰富自己的生命认知。)
不难看出,这个设计既隐含了文本的“共性知识”,又走出了文本的“共性知识”圈,给学生搭建了一个进入文本的个性化台阶:它紧紧扣住了文本的具体内容、个性化的情思以及独特的语言形式,非常适应于《金岳霖先生》这一文本;它将“探寻作家的心灵密码”和培养学生的“文化表现力”相结合,既抓住了语文教学的命脉——贴着语言行走,也找准了语文活动的形式——深情细读。引导学生在语言花园欣赏,从点到面,由浅入深,还不忘花园的守望者。整个设计,从语言感知、情感体验、文化贯通、思维锤炼等诸方面给学生以满足、提升和引导。
文本知识 篇10
关键词:《白鹿原》,陈忠实,知识分子,农民
知识分子与农民两大主体向来是社会历史发展变迁中的重要力量, 他们改变着历史, 也被历史所改变, 同时在他们内部也存在着复杂矛盾的对话, 这一现象反映在整个中国现当代文学创作中, 便是对知识分子与农民两大历史题材的抒写。《白鹿原》运用文化心理结构理论对知识分子与农民进行了深入细致的刻画, “通过自己的笔画出这个民族的灵魂”来。
一
在中国文学长河中, 对农民的抒写基本上是由知识分子来承担, 固然说书人与通俗文化的作者也进行着这种创作, 但是由于历史视野不够开阔, 只存留底层经验而无法揭示底层与其他阶层的相互关系。因此, 只有具有洞悉历史眼光的知识分子才能够在对底层经验的抒写中不仅仅注视自身, 更能展现完整的历史图景。
陈忠实选取了他所熟识的白鹿原为创作的地域背景, 在他看来, “中国乡村一直负载着这个民族精神和心理上最辉煌和最痛苦的记忆, 直至今天, 仍是生活发展中引发疼痛的敏感点之一”。中国的乡土社会, 是熟人的社会, 礼治的社会, 生活各方面, 人与人之间, 都存在着一定的规则, 行为者们对这些规则耳熟能详, 从小开始的长达一生的教育把这些外在的规则外化成为内在的习惯。白鹿原作为中国乡土社会的一个有机组成部分, 种田的老农所遇到的只是四季的更替, 而非时代的变化, 前人所用的生存经验足以尽后人作为生活的指南。就是这样一个安稳不求变的乡土社会, 在二十世纪的时局动荡中成了一口沸腾的锅, 一个鏊子, 行为者们的心理结构遭遇失衡, 旧有价值体系面临崩塌, 新的价值体系尚未建立, 精神世界的裂变加剧了传统文明与现代文明的文化冲突。陈抓住了行为者们的文化心理冲突, 写出了人物灵魂里的奥秘, 使人物性格具有了内在的生动性。
《白鹿原》展示了这样一个大的舞台, 让知识分子与农民活跃于其中, 那么他们之间的相互位置是怎样的?他们之间的对话进行的是否顺利?要解决这个问题, 我们不得不在关注文本的同时, 更加关注创作主体本身, 作为一个具有长期农村基层生活和工作经验的知识分子, 创作主体在多大程度上如实地呈现了两大阶层的复杂关系。陈生长在陕西关中农村地区, 关中地区土地贫瘠, 降雨量不充沛, 农民种地为生。陈自幼便深知农民生活的水深火热, 自身也经历了生活的种种不堪, 忍受过伙食的下等, 城市子弟的白眼。农民的自卑与“生于兹, 长于兹”的恋乡情结使他在本质上更贴近农民。陈非常注重生活体验、生命体验和艺术体验的重要性。写自己熟悉的生活, 写自己熟悉的风景, 写出自己的独特发现, 否则宁可不写。“每个作家对正在经历着的生活 (现实) 和已经过去了的生活 (历史) 的生命体验和对艺术不断扩展着的体验, 便构成了他的创作历程”。参观孔林给他带来的沉重压力迫使他开始重新思索民族命运, 过去的人们心里支柱是什么, 发生了怎样的心理变化, 代表社会道德的知识分子是怎样把自己的关于礼的那套糅合进农民的血液中去的, 它与现代人有着怎样的关系。陈力求还原历史本来面目, 让两大阶层自行疏离、交会、发展, 呈现民族秘史。
二
如前所说, 知识分子与农民在《白鹿原》的文本中呈现出了复杂的对话。传统知识分子历来重视人民的教育, 他们自觉充当道德的楷模, 以身作则, 藐视贵族, 同情人民, 代表正义与良心。朱先生深受关中尚实文化的影响, 为人清高, 视金钱如粪土, 不愿为官, 只有真正为民办实事的时候才肯屈驾。朱先生是陈所创作的理想的知识分子形象, 凝聚了中国士文化和关学文化的精髓, 他的身上体现着典型的抽象知识分子的传统, “居庙堂之高则忧其民, 处江湖之远则忧其君”。陈对他的处理是半神半圣。作为一个具体的知识分子形象, 朱先生与底层的矛盾并没有一味遮掩。他的在城里当裁缝的亲戚一家来他家避难, 朱与他们相处多时, 深恶他们一身市侩习气, 唯利是图, 言行粗鄙。文中对于朱对其的憎恶处理的十分真实, 朱恨不得一颗炸弹将这一家给炸死。试想一个关中大儒, 思想也有其可鄙的一面。朱和历来的知识分子一样, 他们与民众的关系不是一直鱼水相欢的, 也存在着紧张的状态, 或者可以说, 作为抽象的知识分子而言, 他们爱护人民, 当他们以抽象的知识分子的身份去接触底层民众时, 他们是博爱的, 仁义的, 他们彼此没有太多的情感接触, 是教化与被教化的关系;当他们以具体的知识分子的身份与民众来往时, 底层人民的各种狭隘、自私、目光短浅等等的劣根性便暴露无遗, 令自作清高的他们难以接受, 甚至产生强烈的排斥现象。
然而, 知识分子与底层农民的沟通也有较为成功的时候。朱先生与白嘉轩等人的沟通便是典范。白嘉轩一生把姐夫视为圣人, 视为监督自己的精神导师, 对于朱先生的未卜先知的本领更是五体投地, 只要姐夫朱先生要求他做的事他就觉得肯定是有道理的, 肯定是正确的, 朱先生对于白嘉轩的为人也是赞赏有加。然而, 在这里我们不得不一提朱先生与黑娃的对话过程。黑娃作为具有原野般原始冲动力的新生代农民, 不畏阶级压迫, 不畏世俗礼教, 坚强的如石头般的关中汉子, 他敢爱敢恨, 藐视礼仪, 一生追求实现自己的人身价值, 九死未悔。就是这样一个与封建礼教格格不入, 与封建礼法殊死搏斗的叛逆型人物, 最终竟然皈依到朱先生门下, 痛改前非, 这不得不说是封建礼教反叛者的悲哀!
农民内部也存在着不可抗拒的矛盾冲突, 他们之间的对话也是充满艰难的。黑娃对白嘉轩的惧怕感和不逊感, 究其原因, 恐怕还在于黑娃骨子里的农民文化在作祟。白与黑娃的数次亲近都没能使得他们之间的交流变得较为顺畅, 乃至后来黑娃由怕生恨, 打断了白嘉轩的挺得太硬的腰杆。然而在黑娃皈依传统文化时白嘉轩仍然能够宽容接待, 可见白的仁义与宽容。白与黑娃的矛盾交流对话过程不能不说是奇事一件, 实在是一个值得思考的问题。白嘉轩与鹿子霖的关系也深为复杂, 他们从身份上来说, 都算是某种统治者, 有着共同的阶层属性, 更有着共同的利益关系, 陈在这一方面表现不多, 但我们还是透过字里行间发现, 陈和鹿二人表面上水火不容, 实际上却荣辱相连, 二人合力办学校, 发放救济粮, 共同为白鹿原坐下了许多合乎民意的义事。即使是白嘉轩知道鹿子霖的风流冤债债却放任自流, 而对于被统治对象如狗蛋小娥的性散漫却严惩不贷。
知识分子与农民两大主题还会在创作主体们的反省与反思中更加深入下去, 农民文化与知识分子的关系也会更加复杂, 同时也会逐渐明朗起来, 从具体意义上和从抽象意义上来讨论他们, 我们会发现其根源仍在于农民文化, 这种农业社会中以人的依赖关系为纽带的宗法农民的文化, 传统的知识分子从文化心态上来说无法脱离宗法式人格的束缚, 他们的儒家精神是基于他们的宗法式人格来重新阐释的。
参考文献
[1]李星, 陈忠实.关于《白鹿原》与李星的对话[M].山东文艺出版社, 2006.
[2]陈忠实.创作感受谈[M].山东文艺出版社, 2006.
[3]费孝通.乡土中国[M].北京:人民出版社, 2008.
[4]南帆.五种形象[M].复旦大学出版社, 2007.
相关文章:
文本空白01-21
文本01-21
场控文本及警告文本01-21
善用文本01-21
文本识别01-21
语文阅读的文本拓展01-21
一年级语文教学计划第一学期部编版 一年级语文教学计划(实用8篇)01-21
最新部编七年级语文教学计划第一学期 七年级语文教学计划(优秀20篇)01-21
技术文本01-21