学生行为数据库(精选十篇)
学生行为数据库 篇1
1.1 信息化管理现状
当前,校园网已经非常普遍,院领导、各处室、各系部、教研室、实验室等校内大部分办公区域已经实现了互连互通,并且通过专线与Internet连接。校园网的应用使办公效率大大提高,也为开发更多的应用系统提供了平台。辅导员的量化考核管理完全可以充分利用这一平台,使学生管理工作上一新的台阶。
1.2《学生量化考核系统》的构想
量化考核是当前辅导员对学生管理的一个重要手段,但量化考核不是靠一个人能完成的,要想全面了解学生的行为状态,必须依靠各级管理人员,如辅导员、任课教师、学生干部、家长、公寓、食堂等等各部门相关人员。只有协调配合,才能详细监督和引导学生,才能真正达到量化考核的目的,才能真正使量化考核的结果真实、有效,才能让辅导员及学生管理者切实、有效、公平、合理地做工作。
如何进行全面考核?如何实现这一目标?可以利用互连互通的校园网,实现共同参与、集中管理,实现高效、协调工作。在此,只需建立一量化考核数据库,在此考核数据库基础上编制相应软件,然后以考核标准为原则,各级相关管理人员通过该软件及时将学生日常行为数据输入到数据库中;管理人员通过软件即可查看和统计每一学生的行为动态和变化曲线;根据考核数据库,得到学生行为预警信息。
2《学生量化考核系统》的设计
2.1 网络结构设计
学生量化考核系统基于校园网,整体网络结构如图1所示。该网络结构可以划分为两部分:校内和校外。校内网络实际上就是原有校园网部分,用于学生量化考核Client软件的运行和使用;校外主要是家长通过Internet远程登陆到量化考核数据库。
2.2 量化考核数据库设计
量化考核数据库是学生量化考核系统的核心。在量化考核数据库中,主要包含有以下几部分数据:
(1)班级专业信息:包括院系机构设置、专业设置、班级信息等;
(2)学生基本信息:包括学号、姓名、性别、照片等;
(3)量化考核标准:由各个部门统一制定的执行标准,包括行为、性质、权重、预警提醒参数等;
(4)学生量化考核信息;包含所有学生的行为数据和处理结果,是量化考核的核心;
(5)用户信息:使用本系统的用户信息及操作权限。
2.3 学生量化考核Client软件设计
学生量化考核Client软件是实施学生日常管理、考核信息查询统计、预警等的基本软件,学生量化考核Client软件主要包含以下几部分功能:
(1)学院组织机构管理:建立和维护学院的组织机构信息;
(2)开设专业设置:各院系开设专业的设置和维护;
(3)学生基本信息维护:对学生基本信息的输入和维护,如学号、姓名、照片等信息;
(4)班级信息维护:对班级信息的建立和维护,包括班级名称、入学年度、专业,以及班级所属学生的设置等;
(5)量化考核标准信息维护:有关量化考核标准信息的输入和维护;对预警提醒参数的设置;
(6)量化考核信息输入:对学生量化信息的输入以及处理结果的输入;
(7)考核查询和统计:对量化考核信息的查询和统计;
(8)学生行为预警:根据量化考核标准及预警参数等信息对学生行为进行统计汇总并发出学生行为预警信息;
(9)行为对策提醒:根据预警参数和考核标准对某种行为发出预警信息;
(10)用户信息设置:设置用户及权限。
2.4 学生量化考核Web软件设计
家长可以通过远程登陆来访问学生量化考核数据库,学生量化考核Web软件主要包含以下几部分功能:
(1)家长登陆:家长通过浏览器远程登陆学生量化考核数据库;
(2)考核信息查询和统计:对学生量化考核信息的综合查询和统计;
(3)学生行为预警:根据量化考核标准以及预警参数等信息对学生行为进行统计汇总并发出预警信息。
2.5 用户设计
在学生量化考核系统中,共有以下几类用户:
(1)学生管理员:对班级、专业信息、学生基本信息、量化考核标准的输入和维护;
(2)辅导员:对学生量化信息的输入、查询、统计、分析、预警等。
(3)教师:对学生量化信息的输入、查询;
(4)学生干部:对学生量化信息的输入、查询;
(5)领导:对学生量化信息查询、统计、分析、预警;
(6)家长:对学生量化信息的查询、统计、分析、预警;
(7)系统管理员:整个系统的管理和维护。
3 结束语
可以充分调动更多的人参与到学生管理工作中去,形成良好的管理环境,让学生能体会到无处不在的关心,无处不在的亲情;可以让学生管理者及家长有的放矢,既能抓重点,又能顾大局,真正实现现代、高效、全面的管理,使学生管理工作更上一层楼。
参考文献
[1]韩秀敏,张红岩.论教育信息化时代的高校学生管理工作[J].沧州:沧州师范专科学校学报,2006(1).
[2]韦崇岗,肖昌贵.一种高校学生信息化管理方法的实现[J].成都:四川理工学院学报(自然科学版),2006(5).
数据库与行为艺术 篇2
戴汉志的工作建立在他对中国当代艺术身临其境和设身处地的真实感受当中。他持续性地倾注了对中国新艺术的高度的敏感和热情。他的工作方法成熟严谨,扎实有效。早在90年代前期他就在自己的黑白显示器的笔记本电脑上安装了微软公司出品的数据库软件,对艺术家的基本信息进行处理。数据库的精髓在于设计、创建和管理分类查询系统,在长期积累和细致工作下他的数据库日渐丰富完善,对他的策划和组织展览的工作起到了有力的辅助作用。戴汉志的这个数据库以艺术家为主干,以时代、媒介、艺术思潮为线索,在他长时间的努力下逐渐完善成为一部字典,包括多于5000位艺术家的信息,这些艺术家出生于1880年至1980年的中国,他们的信息从各种书籍、画册、期刊、手稿等文献中被甄别、提取、分类、汇集到这个查询系统中。2002年戴汉志去世后这部字典一度无从查考,险些埋没。2013年底在荷兰当代艺术策展人--戴汉志的研究者玛丽安娜·布劳沃女士(Marianne Brouwer)的不懈查找和研究并进行数据恢复后字典得以重见天日。
这个字典并不在于多么完备和权威,而是在于它在全景扫描式的构架中显现出一種历史纬度。这一历史纬度并不是建立在“前卫、实验”与“传统、学院”的分野上,相反地,是将原始资料一视同仁地加以认真整理和研究,这样的态度无形当中夯筑了一个研究和观点得以建立的基础。戴汉志初来中国的时候只是一个曾当过独立艺术家而且上了年纪的学生。他并不能扮演学术话语系统中的角色,也不代表权威机构并把持某种话语权。他只代表自己,一个很大程度上同那些流浪各地的艺术家一样苦苦挣扎的个体。他依靠旅游签证和承租普通民居在北京立足,每三个月或者半年需要离境重新办理签证。这样体制外生存的独立态度和他对当代艺术投入的激情,很自然地赢得了艺术家们的信赖和支持,使他成为同类情况中的唯一。正因为他定期地前往香港办理签证,他能够利用这样的行程与广州和上海等地的艺术家频繁地见面和交流,使自己的经历和研究范围不局限在某个狭小的方面。
如果只是从期刊、画册、手稿等文献研究中国艺术的变化,戴汉志完全可以在欧洲一个具备基本条件的博物馆、大学或者图书馆来进行这些研究。促使他克服种种困难一定要让自己身处其中的是中国令人激动的现实,那些鲜活跃动的人物,那些非身临其境外无法纪录和言说的事件。正是因为他的自然和中立的个人身份,他客观理性而公正无私的品行,他对艺术中的新行动的欣赏和期待,以及他对历史的自觉意识和认真态度,艺术家们愿意与他进行紧密的交流和合作,分享自己的苦恼和喜悦,并无保留地信任他并使他深入地参与到他们的创作中。由于这段历史时期的特殊性,戴汉志的这种参与很多情况是作为法定观察者或者见证人的身份进行的。
戴汉志的见证人身份有几个例子。1989年北京现代艺术大展时唐宋因肖鲁在中国美术馆展厅向自己作品开枪而被警察拘押,他获得自由后向戴汉志写了长信记述他在看守所的经历和他对开枪事件的认识,也讲述了他在看守所中同其他犯人一同做作品的行动。1993年吴山专的作品“柏林劳工”中将“中国前卫”展览的参展权力卖给朱青生,戴汉志充当了合约中的中介方。1994年在刘安平和赵少若的泼墨事件1中,戴汉志作为事件发生前的知情者,无形中被置于一个充当见证人的位置,密谋者为了使事件的谋划和实施避免事后无法澄清和证实的局面,有意安排了这个角色。这一情况在1996年洪浩、颜磊的伪造卡塞尔文献展信函事件2中又一次重演,艺术家非常聪明地利用了戴汉志所能提供的帮助,同时也让他成为一个见证人和同谋者。
戴汉志90年代前期的思想成果主要表现在他1994年发布的“于布王艺术研究会(URARC)报告”中。他将前卫艺术区分为新社会主义和新传统主义,以及丁乙和麦志雄的艺术,因为此二人无法按照同样的逻辑关系分类,所以单独作为一类。新社会主义又分观念艺术和现实主义两个子类,“艺术家表现或者反映他们对现实社会环境的见解和观念,或流露他们对世界的独特看法,称为观念艺术”,“第二个范畴涉及的作品只在特定的情况下存在和成立……这类作品不能与现实相分离,同时也不是表现一个对现实的特定观点……称为现实主义”。新传统主义又有三类:园林装置、书法装置、画论装置。在这些类别下,戴汉志归类了艺术家如陈丹青、段建宇、李天元、王音、张亚杰、余友涵、艾未未、徐坦、赵半狄、耿建翌、李永斌、张培力、顾德鑫、林一林、徐冰、黄永砯等人,使他们分属不同类别。这一十分“另类”的分类方式和研究方法并非为了标新立异,而是展现了戴汉志深具幽默而又力图贴切准确地把握艺术家的创作本质的努力。
nlc202309051319
这份文件原件是A3尺寸,中英文双面复印,折叠成A4大小。这是一种他当时经常采用的发布和传播的形式,甚至展览的请柬都这样制作,每次都复印几百份,邮寄和分发给相关人士。1994年北京的夏天北京发生了很多事件,其他如东村张洹、马六明、朱冥的表演在这份文件中都有反映。文件中“于布王”是法国剧作家阿尔弗雷德·雅里的戏剧作品,首演于1896年巴黎,被认为是超现实主义和达达的先声,国内出版时翻译为“愚比王”或“乌布王”,这一文学形象生动地被戴汉志比拟为现实当中的艺术家赵少若。在报告的结尾,戴汉志写道:“1994 URARC 紧急警告所有抱有不以为然的态度用提出计划代替艺术作品的艺术家”。与那些并不循规蹈矩的艺术家们打成一片,以及由于他的个体身份,戴汉志避免了西方书斋式和官僚式的对中国当代艺术的观察角度。他沉浸在艺术家们大胆和密集的创作当中,同时以一个敏锐而清醒的头脑进行原发性的思考和研究,并且通过大量的策展活动深刻地推动和影响了中国当代艺术的走向。在他已去世十二年的今天,回顾严酷而生机勃勃的九十年代,以及世紀之交之时艺术面临的变化和考验,人们会愈发对戴汉志所表现的特殊意义深有所感。
注释:
1.1994年7月8日晚10:30,在北京东单北大街82号大华电影院二层新梦幻录像厅,北京艺术圈的策展人、批评家、艺术家四十多人在观摩一部实验性的录像短片。他们接到的邀请函上注明的是王劲松、刘安平的录像艺术演示。场地是艺术家李强托人租定的,当晚播放了王劲松、刘安平的录像作品《早安北京》,作品主要纪录了王劲松、刘安平身着类似军装的衬衫,留朋克发型,双手带手铐,乘坐正常行驶在北京公交线路上的公共汽车。放映期间,赵少若在黑暗的放映厅内从屏幕和前排座位之间的位置猛然向观众泼洒墨汁,并在观众们反应过来之前逃掉了。这一行为是刘安平和赵少若事先谋划的,现场有一半观众被泼到,刘安平安排了伍劲拍摄了被墨汁染黑后的观众。戴汉志事先知道这一举动,有意坐在后排座位。在当年秋天戴汉志发布的“于布王艺术研究会(URARC)报告”中,戴汉志以于布王艺术研究会的名义将“金墨水瓶”奖授予赵少若并邀请他担任年度主席。
2.1997年5月,德国卡塞尔文献展之前,艺术家颜磊和洪浩伪造了以“Mr. Ielnay Oahgnoh”署名的卡塞尔文献展策展人的正式函件发给了100多位在国内和海外的中国艺术家。信函为德语,内容是宣布将在当年的第十届卡塞尔文献展中举办中国前卫特展,策展人将前往中国考察,并留下了在北京的联系电话,希望与收到信的艺术家见面等信息。随同信件还有一张中国特展的空间平面图,注明比例尺为1:220。这张图实际依据的就是当时戴汉志居住和工作的单元房的平面图。戴汉志帮助他们撰写了德语信函的内容,伪造信纸信封的工作主要由洪浩完成。利用戴汉志的联系人资料库,他们一同确定了收信人的名单。最后戴汉志委托一位短暂访问北京的德国人巴巴拉女士将伪造的信函和信封从北京带回德国寄出。这封信引起了各种反应,后来也流传出很多笑谈。真相的揭穿是由于在德国和法国居住的艺术家杨诘苍将收到的信拿给他的德籍太太杨天娜查看,杨天娜发现策展人的名字实际上是洪浩、颜磊名字拼音的逆向排列。此后洪浩和颜磊曾在《江苏画刊》以道歉的名义讲述了事件缘由。
学生行为数据库 篇3
1 大数据及大数据分析技术
1.1 大数据的定义
大数据是一个新兴的概念, 目前学术界还未对大数据给出统一的定义。维基百科将大数据定义为:巨量数据、海量数据、大数据, 是所涉及的数据量规模巨大到无法通过人工方式, 在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息;Gartner的定义是:需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。总结这些定义发现大数据应具备四个基本特征:数据量巨大;价值密度低;来源广泛, 特征多样;增长速度快。
1.2 大数据分析技术
大数据分析的核心问题是如何在种类繁多、数量庞大的数据中快速获取有价值的信息。在理论研究上, 数据挖掘技术成为大数据分析的关注焦点。数据挖掘是一项以发现数据中有价值的模式和规律为基本目标的独立的数据组织和写作的建模历程;数据挖掘是商务智能和决策支持的核心部分, 自动化或半自动化程序是构成数据挖掘和核心技术;数据挖掘是为发现大规模数据中所隐藏的有意义的模式和规律而进行的探索、实验和分析。
在大数据分析实际应用方面, 目前广泛采用的是云计算技术。根据美国国家标准与技术研究院的定义, 云计算是基于互联网的相关服务的增加、使用和交付模式, 通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。该技术是2006年由google公司提出, 技术主要包括分布式文件系统GFS、分布式数据库Big Table、批处理技术Map Reduce、以及开源处理平台Hadoop。
2 大数据与大学生网络社交
大数据可应用于广泛的社会、自然科学领域, 包括大科学、RFID、传感设备网络、天文学、大气学、基因组学、生物学、大社会数据分析、互联网文件处理、制作互联网搜索引擎索引、通信记录明细、军事侦查、社交网络、通勤时间预测、医疗记录、照片图像和图像封存、大规模的电子商务等。近年来微博、微信、人人网、脸谱网、推特等社交网站的应用已经深刻改变了人们的交流方式, 大学生是参与度较高的网络社交群体。社交网站快速增长的大学生数量和活跃的大学生网络社交活动, 积累了大量的大学生行为数据, 这些数据完全符合大数据的定义和特征, 并且在这些数据背后, 隐藏着巨大的价值。大学生网络社交大数据的价值主要体现在:
2.1 大学生行为模式的发现
大学生在进行网络社交的过程中会形成大量行为轨迹数据, 例如留言、评论、点赞、发布图文信息、浏览与转发等。对于研究大学生行为的学者而言, 可以通过数据捕获工具收集这些数据, 进行分类、汇总, 采用数据挖掘算法与大数据分析技术对这些格式化、非格式化数据如照片、声音、文本等进行分析, 发现大学生行为变化的规律, 得出大学生的行为特征, 寻找到大学生行为的共性与差异性。
2.2 网络环境下大学生人格特征的分析
由于网络社交具有匿名性、隐形性、没有地理位置限制以及时间上的非同步性, 大学生在网络社交过程中体现出来的人格特征与现实生活中的人格特征存在差异。例如, 现实生活中内向型人格的大学生由于缺乏人际交往则更倾向于在网络社交中寻求存在感。网络社交人格特征成为大学生人格特征的一个重要补充, 在研究大学生行为的同时能够利用网络社交大数据挖掘完整而真实的大学生人格特征, 对指导大学生健康发展, 树立正确的价值, 避免受到网络社交负面影响, 如网络成瘾, 有重要的作用。
3 基于大数据的大学生网络社交行为研究
3.1 数据的获取与处理
首先需要研究大学生网络社交大数据的来源方式, 包括数据来源网站的选择、数据获取方式的选择。目前网络社交数据主要集中在博客、微博、微信及SNS网站, 选择国内主流社交网站平台进行数据获取。另一方面, 主流的大数据获取方式包括基于官方API进行获取、通过网络爬虫工具获取和直接利用开放的数据集三种方式, 比较分析每种方式的优势与劣势及实现的可行性, 选择一种数据获取的方式;其次需要对大数据进行预处理, 研究从数据集中筛选大学生网络社交范围、方式及动机数据的方法, 采用Matlab数据处理软件对大数据进行预处理。
3.2 大数据挖掘算法的选择
目前较为流行的大数据挖掘算法主要有基于聚类、协同过滤和关联分析算法, 研究各类算法的适用范围、特点和缺陷, 选择适合本文研究的算法类型, 在此类算法下研究具体的算法改进方式, 并进行比较分析, 总结出改进算法的前提条件、定理与推论、过程与步骤及相关注意事项。
3.3 大学生网络社交现状的总结
使用Matlab工具进行大数据的预处理、数据挖掘, 从两个方面进行总结:大学生网络社交行为的现状及大学生网络社交人格特征。
3.3.1 社交行为现状包括网络社交对象的范围、交往方式和交往动机
(1) 大学生网络人际交往的对象范围主要包括同学、朋友、亲人和陌生人, 其中同学占到62%, 朋友占30%, 亲人占4%, 即认识的人占96%, 而选择和陌生人交往的大学生只占到4%。因此可以看出, 大部分大学生的网络社交是理性、自我保护的, 社交圈子是其现实人际交往圈子的拓展和延伸, 大学生主要利用网络的便捷性、跨时空性等特点维护现实人际交往圈子, 增进情感和交流, 只有少部分大学生愿意尝试与完全陌生的人进行交流。
(2) 大学生网络社交方式统计了其在博客、微博、微信、SNS网站及其他方式上的比例, 其中使用博客、微博的大学生占72%, 微信等即时通信工具使用占87%, SNS社交网站使用占35%, 其他方式占23%。数据显示以微信为代表的即时通讯工具成为大学生网络社交的主要使用工具, 而曾经热门的SNS社交网站使用的比例大幅下降, 博客、微博仍然是大学生热衷的网络社交方式。
(3) 大学生的网络社交动机包括了出于习惯、交新朋友、共享信息、共同兴趣、人际需求五个方面, 其中出于习惯的占8%, 交新朋友占6%、共享信息占14%、共同兴趣占61%、人际需求占11%。由于共同的兴趣爱好而聚集在一起成为大学生网络社交的主要动机。
3.3.2 大学生网络社交人格特征从两个方面研究
一是不同的人格特征在网络社交上呈现不同的表现, 另一方面网络社交也影响了大学生的人格特征发展。
(1) 根据艾森克的人格三因素模型将大学生分为:外向非神经质型、内向且神经质型及随和稳定型。内向且神经质的大学生在现实人际交往中显得比较冷漠, 但是在网络社交中较易展现真实的一面;而外向非神经质的大学生更倾向于使用网络社交来保持与亲人、朋友的联系, 以及结交新的朋友;随和稳定型的大学生由于性格友善, 包容度高, 适应任何社交环境, 因此在不友好的网络环境中也能进行较好的网络社交。
(2) 网络社交对大学生人格的影响总结为:对于外向非神经质型大学生网络社交进一步增加了其社交资源, 使得这类学生更加自信, 获得更多的满足感与存在感;而对于内向且神经质型的大学生, 网络社交呈现两极分化的趋势, 一部分大学生由于在网络社交中勇于展现真实自我而自信心提高对其现实人际交往起到正面作用, 而另一部分大学生沉溺于网络交往, 减少现实交往的时间, 使得其在面对面的真实交往中更加焦虑, 网络交往对其内向型人格起到负面作用。
4 结论
综上所述, 大数据分析技术的出现为研究大学生的网络社交行为提出了新的方法和思路, 本文基于大数据分析从大学生行为现状和人格特征两方面得出了结论:大部分大学生的网络社交是对其现实社交的补充, 没有过分依赖网络, 并能够从网络社交中获得更多的资源及自信, 结交有共同兴趣爱好的朋友;而少部分大学生存在不同程度的网络依赖, 网络交往阻碍了其现实交往的发展。因此, 对于这部分学生, 教师应给予正确的疏导, 帮助其减少网络社交的时间和频率, 鼓励其在现实人际交往中树立信心。
参考文献
[1]王洪波, 胡璇.大学生网络社交现状研究[J].思想教育研究, 2013 (11) .
[2]巢乃鹏.青年人社交网站使用动机研究[J].图书情报工作, 2012, 56 (2) .
学生行为数据库 篇4
18-30岁年轻用户是手机网民的主流群体,手机网民构成趋向成熟化
艾瑞调研数据显示,从2009年中国手机网民年龄分布特征看:手机网民整体偏年轻化,18-24岁的消费者依然为第一大使用主体,其占比达50.7%。但同时25岁以上用户较去年呈现不同程度增长,如30岁以上用户占到19.4%,较去年占比增长9.8%,25岁以上用户占到43.8%,较去年占比增长17.3%,由此可见手机网民的构成正趋向成熟化。
高中及以下学历仍占主体,但高学历人群日益增多
艾瑞调研数据显示,手机网民用户学历主要分布在高中以及高中以下,合计占比61.3%;与去年相比,大学本科及以上学历网民占比增长3.8%,高中及高中以下网民占比降低3.6%。移动互联网正越来越吸引高学历人群的关注和体验。
高收入群体较去年明显增加
艾瑞咨询调研数据显示,手机网民的月收入主要集中在1000-3000元之间,整体占比51.7%。另外,与去年相比,高收入群体明显增加:3000元以上的高收入人群由08年的4.8%增长到今年的10.6%,占比增长5.8%。值得一提的是,虽然1000元以下低收入人群占到90.0%,但大多为学生群体,而目前中国的90后学生群体绝大多数为独生子女,虽然他们个人没有直接收入,但是通常是由六个直系亲属支撑其消费,已成为中国社会独有的无收入高消费群体,因此该群体同样值得关注。
广东用户比例大幅下降,其他地区用户有所增长;以东部沿海发达地区为主,分布正在趋向分散
艾瑞咨询调研数据显示,从省市分布状况来看,广东依然是手机上网第一大省,占比24.8%,但是同比去年下降了11.9%。艾瑞分析,这是由于金融危机对外贸型经济的冲击和影响,外来务工等流动性人口数量发生变化,以及其他各省手机网民数量增长迅速,导致广东手机网民比例较大幅度降低。艾瑞同时发现,北京、上海、江苏等发达地区省市用户均有不同程度增长,且其他省市用户数量从去年的12.0%增长到今年的24.9%。另外,手机网民集中在中国三大经济中心:华南、华北和华东,三个地区手机网民占比达到69.3%,各地区所占比例较为分散。
调研方法与样本来源:
本次调查主要采用了手机网站联机调查方法进行,在新浪、搜狐、空中网、网易、动感网、凤凰网等15家主流手机网站投放调查问卷,于2009年6月至2009年7月期间通过在这些手机网站投放图形广告和文字链广告,由用户主动参与填写问卷的方式来获取信息。本次调研回收调查问卷超过4万份,经处理排除无效问卷,并根据网民的性别和年龄进行配比加权,最终分析样本数为36286个。
学生行为数据库 篇5
近年来,大数据已经迅速地发展成为了吸引学术界、工业及世界政府关注的热点问题。《自然》和 《科学》杂志刊登了相关专题来讨论大数据带来的机遇和挑战。世界著名管理咨询公司麦肯锡称大数据已经渗透到今天工业和商业的各个领域,成为影响生产力的重要因素。使用和挖掘大数据预示着将带来新一轮生产率的增长和消费动力的提升。O'Reilly媒体公司甚至声称:“未来将属于那些将数据变成产品的公司和人们。”一些人甚至认为大数据可以被视为能够为未来信息经济时代提供动力的一种新的石油燃料。简而言之,大数据的时代已经在酝酿之中。
研究表明越来越多的消费者在做出购买决策时会考虑伦理因素。这种伦理考虑因素可能被视为 “附加价值”并且超越了产品本身的基本需求( Crane,2001) 。在发达国家社会责任消费已成为一个热门的话题,2005 年国际营销机构对西方国家的消费者进行调查,发现54% 的消费者愿意为具有社会责任含义的商品多付钱,然而,中国的消费者对社会责任消费相关概念的了解程度相形见绌,吴福顺等在2007 开展的中国消费者责任消费调查显示,80% 的受访者没有听说过责任消费的概念。随着人们的环保意识逐年增加,国内一些学者纷纷提出要倡导社会责任消费,唤醒消费者的社会责任意识。因此对于社会责任消费( SRC) 的研究成为热点问题。
在大数据时代下,企业和消费者彼此之间的信息变得更加透明。企业通过如云计算、大数据挖掘、大数据设计等改变传统的模糊营销模式的方法来进行精确营销、精确定位消费者、更好地了解消费者的需求、获得更多的消费者。与此同时,由于移动端和Web端的迅猛发展,消费者通过如微博、微信等社交软件以及像网易、搜狐一类的门户网站来获得所需商品的信息、了解商品的最新动态以及对商品进行评价与反馈。如果企业生产的商品出现有违社会责任的问题,消费者会在第一时间了解到相关信息,进而影响消费者的购买决策。随着人们社会责任消费意识越来越高、社会责任和大数据在营销领域中扮演的角色越来越重要。因此,研究在大数据时代下人们的社会责任消费行为是相当必要的。
2 大数据的概念与相关实践
大数据到目前为止还没有普遍的可以被接受的定义。维基百科把大数据定义为: “包罗万象,非常的庞大与复杂以至于很难用传统应用程序来的处理数据。”从宏观的角度来看: 大数据可以被视为一个巧妙连接物理世界、人类社会和网络空间的纽带。在这里物理世界反映于网络之中,并且通过互联网和互联网里面的事物以大数据的形式体现出来。然而人类社会通过各种机器如人类与电脑接、人脑与机器接口以及移动端内部。从这个层面上讲,大数据基本可以分为两类: 一类是从物理世界,通常通过传感器、科学仪器和监视器( 如生物数据、神经数据、天文数据、远程遥感数据)获得,另一类是从人类社会,一般从如客户端和域名处( 如社会上的网络、互联网、健康、经济、金融和交通等)获得。学术界对大数据的描述一直存在着一定的争议,并且对大数据模型也一直在不断地发展进化。很多科技行业的供应商和其他的专家赞成高德纳公司提出 “3V”模型,他认为大数据具有体积大( huge Volume) 、速度快( high Veloci-ty) 、种类多( high Variety) 的特征,而且的提供具有需要形成一种提高决策、洞察发现能力和设计优化的能力的信息。一些工业专家为大数据的概念增加了第四个 “V”———精确( Veracity) 意味着数据一定是可靠的。其他人甚至添加了更多的 “V”———形象化( Visualization) 和价值( Val-ue) ,分别代表了数据在描述事物和多组织的重要性; 词汇( Vocabulary) 指的是元数据或者描述数据的数据; 集合地点( Venue) 指大数据可以涵盖元数据的各种特性。国际首席信息官联合协会( NASCIO) 为了便于衡量加入了最后一个 “V”可变性( Variability) 并且加入了一个 “C”复杂性( Complexity) 。但是原始的 “3V”模型为大数据概念提供了一个被大量工业企业用户认可的准则———大数据的来源是从高速运转的公司中输入和输出大量的原始的不同数据。大数据与普通传统的数据之间存在着结构与存储方式上的区别。为了了解大数据和普通数据之间的不同,我们必须认识到先进的科技在过去10 ~ 15 年间已经改变过去了数据存储的方式。在过去,大部分数据都是来自于自然界或是被结构化的事务处理型的数据。它同时也事先被确定了格式和长度,这使它可以很容易地适合固定领域的相关数据库或者电子表格,使它非常易于比较、组织和分析。由于数据的来源变得不同,数据已经变得没有固定的结构了。数据受到像照片、其他的图片、数据和文章、视频文件、从传感器传来的实时数据、电脑、短信和微博、地理数据和地图以及音频和社交媒体上的音频等的多重挑战。例如,它们没有一致的格式和长度。这些数据不容易融入关系数据和表格,并且它们更大、更难以存档。正是因为大数据具有很大的价值、大数据已经基本改变了我们生活、工作、思考的模式[1]。大数据对国家发展、科学研究、工业进步、跨学科研究方面有很大的作用、在帮助人们更好地理解现实意义、帮助人们更好地预测未来等方面的发展与研究有重要的意义。然而事物具有两面性,大数据由于具有数据复杂性、系统复杂性等特点会给人们在大数据挖掘和利用的过程中带来很多挑战。有些企业的部门通过大数据能听到客户反馈,营销者可以使用大数据来了解产品使用趋势,寻找竞争情报甚至得到学习提高客户满意度的方法,同时还可以节省资金成本。
3 社会责任消费的概念与维度
关于社会责任消费或伦理消费出现的证据可以追溯到百年之前( Crane,2001) 。然而,学术界对这种消费模式的研究大约起始于19 世纪80 年代。Webster ( 1975) 是第一个通过对早期( Berkowitz和Lutterman,1968) 的有关个人社会责任相关文献的研究,把具有社会责任消费意识的消费者定义为 “一类会考虑个人消费行为对社会造成影响或尝试通过个人购买行为来给社会带来改变的消费者”。他的定义强调了具有社会责任消费意识的消费者能够意识到社会问题,乐于从事社区活动并且相信个人力量会给社会带来改变。他的研究给企业社会责任消费行为领域研究打下了基础并且从这个层面上来讲,他为未来相关研究提供参考。在Webster研究之前,社会责任消费被认为同代表一种不计个人得失地去帮助其他人的一种社会意识( Berkowitz和Lutter-man,1968) 。其他的学者把社会责任消费定义为一种环境意识和责任行为。Henion ( 1976) 和Antil ( 1984) 认为社会责任消费在于消费者做出与环境资源有关的购买决策。之后,学者尝试探求具有社会责任消费意识的消费者与社会和环境友好关系之间更深层次的关系( Engel和Blackwell,1982) 。Roberts认为具有社会责任消费意识的消费者是购买他们认为对环境有积极( 或较少的负面) 影响或/和通过自身拥有产品的购买权力来表达现阶段对社会和环境问题关心的人。近年来很多学者的研究同样受到Webster的影响,而其他学者对社会责任消费采取了更加狭隘的观点。因此。许多学者进行基于社会责任认知的消费者行为的研究( Brown和Dacin,1997; Webb和Mohr,1998) 。一个具有社会责任消费意识的消费者会避免从危害社会的公司购买产品并且愿意从那些帮助社会的公司购买产品( Mohr,Webb和Harris,2001) 。联合抵制某个公司的产品是一种典型的社会责任消费行为。就像社会责任消费被不同学者用不同的方法进行定义一样; 它也需要通过不同的方式来进行测量。在早期的研究中,社会责任消费被( Berkowitz和Lutterman,1968) 研究的社会责任消费尺度来进行测量( Anderson和Cunnin-gham,1972; Anderson,Henion和Cox,1974) 。这个8 项测量维度来源与生态学和消费者日常生活中的个人社会责任消费的程度相关。它描述了一个人与周围环境相关联的程度以及一个人对他人或周围事物的关心与重视程度,例如: “你做了让你的朋友不太高兴的行为但这也不坏,因为你不能一直取悦身边的所有人”、 “对现在的事件和公共事项没有必要担心,毕竟我不能为他们做任何事情。”这个量表的标准尺度不包含任何与消费者行为相类似的条款并且对消费者行为的研究并不完全适用。接下来是对社会责任消费行为早期的测量方法,社会责任消费通常被单独用消费者社会责任行为量表来测量。例如,Webster ( 1975) 建立了社会责任意识量表来测量人们的社会责任消费行为( 使用可再生服务,重复使用纸质购物袋,使用低磷清洁剂等) 。用同样的方式,Brooker ( 1976) ,Belch ( 1979,1982) 和Antil ( 1984)用类似的量表测量社会责任消费或以对环境问题的关心作为指标。Roberts' ( 1995; 1996) 的研究是社会责任消费测量维度的一个转折点,因为他们在研究过程第一次尝试在量表中加入社会方面的因素来进行测量。他的量表包括两个大的维度,包括18 项生态意识的消费行为的维度,并且这些维度的方差是0. 49,用来描述保护环境的行为趋向和社会责任意识的消费行为维度,一类获得通过消费者行为来获取消费者社会担忧意识的维度。两个维度具有良好的内部一致性,α 系数分别为0. 95 和0. 86。Crane ( 2001) 按照一个能够影响消费者购买决策的与众不同的伦理学方法设计了一个研究框架。尽管他的研究没有给社会责任消费一个明确的定义,但是它提供了一个了解这种消费行为的框架。Crane把社会责任消费扩展为四种不同的伦理侧面: 产品水平( Product Level) 、营销水平( Marketing Level) 、公司水平( Corporate Level) 、国家水平( Country Level) 。对每一个水平而言,伦理扩展层面可能既不积极也不消极。这种方法帮助Crane证实了产品本身没有道德和不道德之分,但是它可以作为一种伦理属性。这个框架可以为人们尝试衡量社会责任消费提供一种依据。本文选用国内学者肖捷( 2012) 在Web在2010 年开发的社会责任购买和使用量表( Socially Responsible Purchase and Disposal scale DRPD) 做我国情境下的应用和检验。
4 大学生社会责任消费行为调查研究
大学生身为移动端和Web端使用的主力军,更是大数据的主力来源之一,在如今信息高度透明和发达的大数据时代,大学生消费者对释放个性、平等自由的追求,使他们愿意表达自己的观点与诉求,中国大学生庞大的数目更是未来市场的消费主力军。因此,了解大数据时代下大学生社会责任消费行为尤为重要。
本研究采用定量与定性研究相结合的方法。其中,定性研究采用小组访谈的方法,旨在对现有文献进行梳理,结合实地访谈,进行测量问卷的选择与检验,为后期定量研究做基础准备工作。定量研究采用问卷调查法,利用前期选择和测定的量表进行数据的搜集与分析。从而了解大数据时代下,大学生消费者的社会责任消费行为意识与状况。定性阶段的小组访谈采用便捷抽样和判断抽样在目标总体中进行样本选取。问卷调查的样本采用改了抽样的方法中的系统抽样和非概率抽样中的配额抽取样本。焦点小组访谈在长春、北京、广州等地区对当地大学生分三组,每组10 人进行访谈;问卷调查在网上随机选择样本量为300 的样本进行调查。
本次研究我们在网上发放了300 份问卷,共收回300份,其中有效问卷290 份,通过分析290 份有效问卷,我们得出以下分析结果。
第一,善因营销是指企业与非营利机构,特别是慈善组织相结合,将产品销售与社会问题或公益事业相结合,在为相关事业进行捐赠、资助其发展的同时,达到提高产品销售额、实现企业利润、改善企业的社会形象的目的。对于企业善因营销方面,当某些企业对责任问题比较关注,并有选择地针对社会所需做出反应,或从营业收入中拿出部分来回馈社会时。大学生消费者大多是对企业的类似行为持同意或中立的态度,总体上大学生消费者更倾向购买善因营销的企业的产品。
第二,大学生在对支持履行高级社会责任的企业行为的态度方面。根据Caroll的企业社会责任金字塔模型的四个层次: 经济责任、法律责任、伦理责任和慈善责任。超过60% 的大学生消费者对认真履行这四方面责任的企业有明显的购买倾向。而且大学生消费者更愿意履行这四种责任中慈善、伦理责任,进而产生消费行为倾向。
第三,大学生对企业使用童工、血汗工厂这类违反了相关法律法规的行为,大部分呈中立态度,没有明显的消费拒绝与购买倾向。但是对于企业破坏环境和商业欺诈等类似行为,近70% 大学生消费者持有明显的反对与拒绝态度。
第四,在环境保护和绿色消费方面。大学生消费者在节约能源、保护环境、保护动物等方面具有很强的意识,很多大学生甚至做出拒绝购买类似企业的产品的行为。除此之外,大学生在做出的购物选择时也会着重考虑环保因素。
第五,60% ~ 70% 的大学生消费者具有回收再利用的消费习惯。例如,重复使用购物袋、正反使用信笺纸、分类丢弃垃圾、回收旧报纸杂志等方面都体现了大学生消费者的社会责任消费行为意识。
第六,在生活习惯方面。70% 左右的大学生消费者对选择步行、公交、单车或拼车,减少温室气体的排放这类低碳行为以及节约使用水、电等能源,重复使用纸盒、塑料盒等一次性用品这类良好的社会责任消费习惯表示赞同,并有明显的履行倾向。通过调查我们发现,大约有20% 的大学生消费者对此类行为持有中立态度。
5 建议及局限性
社会及学校要充分利用大数据这个时代背景,通过移动端和Web端向大学生进行社会责任消费的渗透,多传播健康、正向的内容。通过研究,我们发现当代大学生绝大多数具有良好的社会责任消费意识,很多大学生是社会责任消费行为的传播与支持者。在大数据时代这样信息双向传递、快速传播的背景下,大学生消费者更容易捕捉和传播有关企业产品的信息,进而做出消费行为。从长远角度来看,大学生消费者社会责任消费意识越强,对企业绿色创新、环境保护、能源利用等方面的发展越有益,越利于国家和社会的可持续发展与进步。
综上,我们的研究也具有一定的局限性,受访人数的限制导致了数据具有一定的局限性,难以具有普遍的代表性。其次,大学生消费者在填写问卷的时候具有一定的主观意识,很难完全反映大学生日常社会责任消费行为履行的真实情况,从而使数据结果具有一定的主观性。
摘要:在对国内外文献进行回顾与分析的基础上,通过问卷、访谈的方式从6个方面对大学生消费者在大数据时代社会责任消费行为进行研究与分析,得出大学生消费者大部分具有社会责任消费意识,并且很多大学生在日常消费过程中会做出社会责任消费行为的结论。最后从合理利用大数据时代这个有利的背景的角度给予关注与思考。
关键词:大数据时代,社会责任消费行为,大学生,问卷调查
参考文献
[1]V.Mayer-Schonberger,K.Cukier.Big Data:A Revolution That Will Transform How We Live,Work,and Think[M].U.S.:Houghton Mifflin Harcourt,2013.
[2]R.Thomson,C.Lebiere,S.Bennati.Human,Model and Machine:A Complementary Approach to Big Data[R].Proceedings of the2014 Workshop on Human Centered Big Data Research,HCBDR,2014.
[3]A.Cuzzocrea.Privacy and Security of Big Data:Current Challenges and Future Research Perspectives[R].Proceedings of the First International Workshop on Privacy and Security of Big Data,PSBD,2014.
[4]吴福顺,管竹笋,郑若娟,等.2007中国责任消费调查报告[J].WTO经济导刊,2008(4).
[5]肖捷.中国情境下社会责任消费行为量表研究[J].经济管理,2012(3).
学生行为数据库 篇6
微信作为即时通信的代表,由于其良好的展示、记录、评论、点赞、支付等功能,迅速成为大学生网络社交的主流工具,而“朋友圈”功能则正悄然改变传统校园人际交往模式,这些改变的方式及原因对研究大学生交往行为具有重要意义。
以往对于交往行为的研究主要采用问卷调查和访谈等方式获得数据。传统的问卷调查方便样本的抽样采集和数据统计分析,而忽视了微信作为网络社交特有的传播效应和传播特征。因此尝试不同的调查方法有利于获得不同来源的调查数据,从而提升研究效度。
一、虚拟田野考察法在网络社会学研究中的应用
(1)虚拟田野考察法的提出。田野考察最早应用于人类学研究,原指经过专门训练的人类学者亲自进入某一地区,通过直接观察、访谈、居住等参与方式获得第一手资料的过程。?劅??剾?
网络田野考察是与网络传播学应运而生的概念,一般指在特定时间内,通过持续的网上参与方式获得虚拟社区数据。
(2)虚拟田野考察法研究的意义。采取虚拟田野考察法研究微信“朋友圈”对大学交往行为的影响,目的是使调查者参与到网络这个“田野”中去,以期获得更加符合网络社会特性的研究数据。因此虚拟田野考察法不仅可以作为工具,也可以作为方法论来研究大学生交往行为的虚拟关系与现实关系的强弱对比,维系关系的因素,网络舆论的形成与传播等,因此是一种值得尝试的进入网络社会研究的方法。
(3)虚拟田野调查法操作的流程。本文作者首先通过微信与自己的好友进行交流和沟通,向他们说明自己的研究课题以及研究目的,请求他们配合完成调查问卷,并且请求他们转发自己朋友圈中的其他大学生,请求他们配合完成调查。本次调查共获得有效调查问卷53份,其中来源于自己朋友圈42份,来源于非朋友圈好友11份;男生33份,女生20份;本科生46份,研究生7份,通过前期文献综述研究,认为符合样本采集要求,可以用于研究目标的进一步分析。
二、微信“朋友圈”对大学生交往行为的影响
根据企鹅智酷发布的最新2016版《微信数据化报告》(以下简称报告),截至2016年3月微信活跃用户已达5.49亿,接近一半活跃用户拥有超过100位微信好友。基于本次虚拟田野考察得到的数据,采取内容分析法,并将定性分析与定量分析相结合,挖掘信息背后的意义。
(1)使用微信朋友圈后,你和同学朋友交流时间发生了什么变化?根据统计9.43%的受访者认为交流时间大大增加,60.4%的受访者认为有一定程度的增加,认为减少的为3.77%。通过分析我们得出:使用微信朋友圈后大学生的社交时间出现大量增加或减少的都是少数,但超出一半的学生认为交流时间有一定程度的增加,这一数据与《报告》中“55.2%的微信用户每天打开微信超过10次”相吻合,虚拟社交时间的增加带来的是其他活动时间的减少或侵占,大学生中“低头族”现象凸显,上课玩手机现象愈演愈烈,已成为高校学生管理的顽疾。
(2)通过微信朋友圈,你和同学或朋友的关系发生了什么变化?分析显示,认为与同学或朋友关系更亲密占18.9%;有所改善,但不明显占62.2%;没有变化的占11.3;变得更糟糕的占7.5%。朋友圈的使用对大学生的人际关系是有帮助的,能够帮助大学生克服实际人际交往中技巧缺乏等社交焦虑情绪。由于朋友圈信息发布的角色选择性,使大学生能够按照自己的理想社会角色传播个人信息,一定程度改善了大学生的人际交往,但我们不能忽视仍有部分大学生认为人际关系变得更糟糕了,其背后原因值得深究。
(3)使用微信朋友圈后,你与陌生人的交往发生了什么变化?数据表明,与陌生人的交往情况的改变程度,大量增加的有3.8%;有一定程度增加的有37.7%;没有变化的有56.6%;减少仅有1.9%。此项数据印证了微信朋友圈主要是一个“熟人社区”,这种熟人社交方式具有极高的安全性和私密性,其交往模式基本基于现实生活的联系和交集,陌生人成为朋友圈容易带来安全、诈骗等风险,因此大学生谨慎选择朋友圈好友值得肯定。
(4)使用微信朋友圈后,你的生活方式发生了哪些变化?总结大学生们使用微信后主要生活方式变化最高的分别为:(1)倾诉方式的改变,大学生将微信作为第一自我倾诉工具,借助文字、图片甚至表情符号等方式在朋友圈中记录自己内心深处的真实感受,并从朋友圈互动中获得现实生活中难以实现的跨越空间的心理体验。(2)信息获取方式的改变,很多大学生每天早上醒来第一件事就是躺在床上刷微信,晚上睡前也要刷完微信才肯睡觉,微信已成为了解周围的动态、分享各类知识的第一选择。(3)支付方式的改变。反馈调查的学生中100%使用过微信红包、微信支付等功能,这一数据比《报告》中84.7%的用户使用微信支付功能要高出很多,这也与大学生群体易于接受新鲜事物的特性相符合。
三、微信“朋友圈”与其他社交网络在交往行为上的差异
(1)熟人社交圈。与微博、QQ等虚拟社区不同,微信朋友圈的好友来源主要是手机手机通讯录和QQ好友,多为家人、同学、朋友等。陌生人未经允许不能成为用户圈内的好友,而推荐功能也仅限好友推送。因此,朋友圈与其他社交平台相比是一个以熟人为主的虚拟社区,用户之间的交流更多的发生在熟人之间,交流内容更加随意、多样,私密性更强。在这样一个相对私密的空间中,大学生会有意识或无意识进行“印象管理”,如果朋友圈展示的形象与现实生活的影像差距过大,给微信好友制造出判若两人的感觉,容易被朋友圈贴上“虚伪”的标签,最终影响到使用者与圈中好友的人际关系。
(2)交往选择权变大。微信对朋友圈中好友管理有一个特殊功能就是“不让他看我的朋友圈”和“不看他的朋友圈”,这种设置是在隐蔽状况下进行的,被设置人毫不知情,也可以避免陌生人成为好友后的信息泄露和非目标人群传播。第二个特殊管理功能是好友分组设置,可以将好友无限次的分在不同的组别之中,在发布每一条信息时可以选择一个或多个组别“不可见”功能。大学生通常会按照身份背景、关系亲疏等标准对好友分类管理,不仅可以为以后的社交活动提供便利,还可避免发朋友圈时由于一时疏忽冒犯他人的尴尬。在好友分组的基础上,向不同的人群展示不同的内容重点,具有了更大的交往选择权。
(3)互动模式变化。与微博、QQ将所有的互动信息全部向好友显示的不同,微信朋友圈对非共同好友是不能看到他人的回复的。由此带来的朋友圈互动模式呈现出了变化:一是一对多的互动模式,即在无共同好友的情况下,有多个好友参与的互动,但每个朋友圈好友只能看到自己的互动内容;二是多对多的互动模式,即互动好友中有共同好友,这样共同好友之间的留言是可见的,并且共同好友之间可以互相评论交流。由于非共同好友之间不能看到彼此的留言,所以参与讨论的用户可以表达自己的真实想法,同时不会造成不同圈子的认知误差,因此微信朋友圈的沟通的气氛更加轻松、愉悦;另一方面,挑起话题的人通过交流可以获得不同好友的观点、意见,这不仅开阔了话题挑起者视野,而且也加深了彼此之间的了解。
(4)交往方式多样化。微信朋友的交往方式除了网络社交平台如QQ常见的点赞、评论功能外,其方便快捷的“群聊”功能和语音互动正成为大学生的新宠。相较于班级群、同学群等固定成员性质的虚拟社区,微信为用户构建了更加隐蔽的群组管理方式,大学生随时根据需要建立一个群聊,根据自身需要发布不同的信息,与好友形成多种互动方式。建立在移动通信基础上的微信,在大学生群体中语音功能使用率较高,有66%的受访大学生通过微信语音与父母、同学联系。而微信红包则成为改变大学生交往行为最大的推手,在朋友圈发红包和抢红包成为活跃和改善人际关系手段的同时,也为大学生带来了新的烦恼。
四、微生活方式下大学生交往行为引导策略
(1)引导交往规范。微信朋友圈是一个半公开化的社交平台,具有私密性和开放性双重性质。现实社会成熟的、约定俗成的行为规范在网络社交行为中受到了较大的冲击,因此构建合理有序的大学生网络交往行为规范成为社会和学校急需解决的问题。在道德层面,朋友圈的交往不能脱离网络道德的约束,网络道德宣传教育要从技术和宣传层面操作,而大学生由于其较高的个人素质,更便于学习和遵守网络道德;法律层面,要建立健全网络交往法律法规机制建设,加大不良信息传播、个人隐私泄露、诈骗等行为的惩罚力度,防止大学生因为无知或冲动犯罪。
(2)加强信息监管。微信朋友圈由于其网络传播特性,谣言传播现象普遍,并对大学生的价值观和交往行为造成了较大影响。解决绝谣言广泛传播问题,必须要加大对朋友圈信息的监管力度。作为微信的开发商,腾讯是朋友圈信息的直接监管部门,要加大发布的各类信息的监管力度,对信息进行实时核查,对利用朋友圈进行非法行为的用户取消其朋友圈的使用资格。同时作为信息发布者和接收者也具有不可推卸的责任,大学生要加强自身修养,提高自己的法律意识,知法守法,不在朋友圈中进行非法活动。
(3)合理设置分组。微信独特的非好友不可见功能,为朋友圈的好友管理提供了技术支持。大学生通过合理设置分组,分类管理好友,依据自己的意愿在圈内扮演各种网络关系角色,可以帮助大学生实现与他人关系的维系、强化,但必须注意一些排除在外的非目标好友可能通过其他渠道看到信息的情况,影响大学生的正常交往。
(4)强化支付安全。朋友圈红包、“微商”的出现是微信从社交平台拓展到移动支付领域,成为巨大的移动支付入口,但微信支付的安全问题一直饱受争议,大学生们不要随便扫描未知的微信二维码,选择正规商家,交易时认准安全支付;保护好个人隐私,但凡需要填写个人身份信息时,应仔细分析判断,任何时候都不要轻易泄露个人资料;最好安装一些可靠的安全防护类应用,并实时关注病毒库的更新,及时升级,确保手机处于被保护状态。
参考文献
[1]CNNIC:第38次中国互联网络发展状况统计报告[EB/OL].http://www.askci.com/news/hlw/20160805/17065450828_4.shtml.
[2]庄孔韶.人类学通论[M].太原:山西教育出版社,2005:248.
[3]2016年微信用户数据报告[EB/OL].(2016-03)http://sanwen8.cn/p/22340TT.html.
[4]唐金杰.微信朋友圈的人际互动模式研究[D].哈尔滨工业大学,2015.
学生行为数据库 篇7
数据库原理是计算机领域中最重要的技术之一, 是软件学科的一个独立分支, 是构成信息系统的重要基础。该课程的教学目标是使学生能较系统地掌握数据库原理、数据库管理系统的应用及数据库应用系统的开发与设计等知识与技能, 达到具有一定的数据库应用及相关系统的设计与开发能力的目的。从此可以看出, 数据库原理是一门理论性和实践性都很强的课程, 因此, 传统的数据库教学形式——“教师上面讲, 学生认真听”——已经不能适应信息高速发展的人才教育要求。目前学生在学习过程中存在对理论学习的厌烦和对实践学习的茫然等问题, 最终教学效果不能达到社会职业所需能力要求。如何让学生对数据库学习产生兴趣, 如何让他们通过学习掌握数据库理论和实践相结合的能力, 最终达到数据库相关职业所需能力?对原数据库教学方式进行改革势在必行。经过多年的数据库教学实践, 探索性的以行为为导向, 并将双主体互动式教学法、案例教学法、引导式教学法等多种教学法结合运用在理论教学、实践教学等各教学环节中。
1 行为导向教学法
行为导向教学法是学生同时用脑、心、手进行学习的一种教学法, 这种教学法是以职业活动为导向, 以能力本位 (人的发展为本位) 的教学。行为导向教学法是全面的和学生积极参与的教学。在课堂上, 由教师和学生共同决定要完成的行为产品引导着教学过程。行为导向教学强调唤起学生的学习动机和激发学生的学习热忱, 是建立在让学生熟悉周围的环境的基础上, 对所学的内容有想学会的欲望, 进而不断提出问题、解决问题, 达到学习的目的。行为导向教学并不是使用一种方法, 而是涵盖任务教学法、案例教学法、情境教学法、项目教学法、基于项目的引导文教学法、角色扮演法等各种先进的教学方法。教师可以根据教学内容特点和目标的不同而选择不一样的教学方法。本课程整个教学过程中主要运用任务教学法、案例教学法、引导法、讨论法、项目教学法、双主体互动式教学法。
2 数据库原理课程的行为导向教学方案
数据库原理课程的行为导向教学方案主要以开发维护数据库应用系统的职业行为为导向, 将本课程教学内容分解为数据库基本概念、关系代数、SQL语言、概念模型设计、逻辑结构设计、数据库编程、数据库安全性、数据库恢复和并发技术八大模块, 根据各教学内容及教学环节的不同采用不同教学方法, 总体方案如表1所示。
2.1 理论教学环节方案设计
概念是理解数据库原理的基础。数据库原理课程中不少概念比较抽象、难理解、易混淆, 针对这一现状, 本方案采取具体——抽象——具体的教学方式, 先引导式的讨论, 然后举现实例子, 再提出概念, 最后让学生举例子, 以帮助加深学生的理解和掌握。以下将举一个概念的讲解思路设计为例:
“数据”是本课程的第一个概念, 也是最核心的概念。但容易与“数字”混淆, 该概念讲解思路设计:
(1) 提问“同学们认为数据是指什么?或举例”让同学们讨论并说出自己的看法;
(2) 从他们的看法出发, 谈其中哪些是属于本课程所定义的“数据”;
(3) 举其它一些大家身边并感兴趣的例子“如Q Q头像、QQ聊天记录、Q Q视频”;
(4) 提出“数据”的定义:描述事物的符号记录;
(5) 最后提问“根据定义, 你们举些实例。”让学生各抒己见, 以提高学生学习的主动性和兴趣。
实践理论类知识占据数据库原理课程知识点的大部分, 因为本课程是一门实践与理论联系非常紧密的课程。这类知识点是学生比较关注而有兴趣的, 但如果在课堂上一味教师讲或教师不明确该实践理论在数据库相关工作中的重要性, 那不少学生会失去学习兴趣, 认为上课内容枯燥或不值得听。针对这些问题, 依据以职业行为为导向的原则, 教师首先要告知学生该实践知识点在相关职业中何种情况将使用到, 它将完成一个什么工作;然后根据知识特点, 选择性的采用引导法、案例教学法、项目教学法进行讲解, 但在这一教学过程中必须贯彻双主体互动式教学法, 让学生参与进来实践, 并最后由教师进行评价或其他学生对其进行评价。以下将举一个实践理论类知识点的讲解思路设计为例:
“用SQL进行查询”是课程中的核心实践之一, 该实践理论知识点的讲解思路设计:
(1) 问“知道QQ登录时如何验证输入的QQ号和密码正确吗?”, 停顿片刻, 学生必定将对此娱乐生活中经常碰到的事情感兴趣;
(2) 告知“其实这里就要用到我们这堂课要讲的查询来实现”并在黑板上写出查询的SQL代码“SELECT COUNT (*) F R O M Q Q W H E R E Q Q n o=输入的QQ号AND QQmm=输入的QQ秘密;”做简单的解释;
(3) 引出查询的SQL语法, 并对照该查询实例进行讲解;
(4) QQ案例的其它查询实例讲解, 如QQ上显示的在线人数是如何用SQL获得, 其讲解过程中可以采用学生进行代码填空的方式让学生参与进来;
(5) 布置2~3道课堂练习, 并采取点名或自愿进行演板, 请其他学生批改;
(6) 教师总结点评。
由于实践理论知识点多, 学生演板的机会也不少, 因此教师可以采取“演板只加分不扣分”的原则来激励学生踊跃上台演板, 提高教学效果。
2.2 实验教学环节方案设计
实验对于实践性极强的数据库原理课程是非常重要的, 但当前该教学环节存在一些问题, 比如学生实验准备不充分, 在实验课的有限时间内完不成, 不懂不问教师, 有个别甚至上网玩游戏, 对实验敷衍了事。针对这些问题, 设计了以下实验教学环节教学方案:
(1) 教师应采取所有实验课开始前进行所有实验的总体连贯性的介绍, 让学生知道各实验所完成的任务及其之间的相关性;
(2) 每个实验提前要求学生按照实验指导书准备, 编程类实验要求先设计出代码, 操作类实验要求先熟悉基本操作, 综合设计性实验要求先完成大体设计;
(3) 实验课上让学生将准备内容完善并演示, 其中教师不仅要对提问的学生进行解答, 也要不断巡回每位学生, 对碰到问题而又不问的同学进行引导式的提问并教其根据DBMS显示的错误信息来发现问题、解决问题;
(4) 学生以实验报告的形式进行自我评价, 教师根据学生实验课表现和实验报告进行每位学生的评价;
(5) 在课堂教学中进行上次实验常见问题的讲解。
2.3 考核方案设计
目前大多数课程考核侧重理论考试成绩, 实践学习成绩的考核往往不被足够重视, 而对于以行为为导向的教学是侧重实践的评价, 只有这样, 所教学生的能力才能接近社会所需职业能力, 学生才不会是高分低能者。为了改变现状, 根据数据库原理课程的实践性特点, 采用纵向评价方式。所谓纵向评价, 就是在整个课程学习当中都作为考核点[1]。具体考核方案设计如下:
(1) 采用平时考查、课程实验、期中考试和期末考试相结合的综合评价方式;
(2) 平时考查包括课堂提问和作业、课后作业、出勤率。其中课堂提问和作业演板成绩采用“只加分不扣分”的原则, 出勤率低于某个值取消考试资格;
(3) 课程实验考查包括实验课堂表现、实验检查成绩和实验报告成绩;
(4) 由于上半学期学习的主要是数据库实践性知识, 期中考试采取上机逐一检查考试方式;
(5) 根据课程知识点的特点不同, 期末考试选用上机实践考试+纸质理论考试, 上机实践考试主要考查数据库的概念及逻辑设计、表的创建、插入、查询和视图的创建, 数据库编程等知识点, 纸质理论考试主要考查基本概念、数据库范式、数据库恢复和并发等理论知识点。
此种考核方式对提高学生理论学习的兴趣和调动实际动手能力起到推动促进作用。采用纵向评价方式, 可以更客观的评价学生, 更及时掌握学生的学习现状。根据学生不同情况, 可以进行课后不同的辅导教学, 因此达到更好的教学质量。
2.4 课程设计方案设计
数据库课程设计一般安排在课程教学之后独立进行, 因此, 学生经过课程教学后, 都具有一定的数据库设计开发维护能力, 课程设计的目的是进一步培养整个数据库应用系统的设计开发能力和团队协作能力。在该教学环节中存在着学生对所选题目不感兴趣、时间安排不好、不能按时完成等现状。针对这一现状, 课程设计方案采用学生提前分组、自由选题、教师分段检查的方式, 并将任务教学法贯穿于该方案, 任务教学法是一种以学生为中心, 以任务为驱动的教学方法[2]。防止课程设计时间不够完成课题, 教师可以提前依据好中差学生搭配的原则, 安排学生分组;为了提高学生兴趣, 由学生按组讨论自行选择感兴趣的题目, 明确各自任务;各组成员按各阶段任务完成课题;教师帮助解决学生在课程设计中碰到的问题并协同学生进行分阶段任务完成情况评价, 直至最终课题全部完成。
3 结束语
为了让高等学校学生与社会职业需求人才接轨, 课程教学改革势在必行。数据库原理课程是信息系统的核心基础, 是实践性强的课程。因此对数据库原理课程的教学改革尤其重要。此文初探性的设计了以职业行为为导向, 结合双主体互动式教学法、案例教学法、引导式教学法等多种教学法的一套教学方案。此方案从理论教学、实验教学、考核、课程设计四个教学环节进行设计。经过分析探讨, 该方案可以调动学生的学习兴趣, 增强学生动手能力, 进而提高教学质量, 以适应社会中数据库相关职业的需要。
摘要:针对目前数据库原理课程教学中存在的学生兴趣不足及培养结果与社会需要能力不吻合等问题, 该文介绍了行为导向的教学方法, 并探索性的设计了一套基于该教学法的教学方案。该方案是以职业任务和职业活动过程为导向, 结合运用双主体互动式教学法、案例教学法、引导式教学法等多种教学法的一套贯穿各教学环节的教学方案。并将它运用在数据库原理课程的教学实践中。
关键词:行为导向,数据库原理,案例教学法
参考文献
[1]孙艳秋, 张颖, 刘建平.数据库课程的教学改革初探[J].现代计算机.2009 (;7) :81-83
学生行为数据库 篇8
近年来, 各行各业都从不断发展的信息技术中寻找到新的灵感, 图书馆界也借助信息技术迎来了全新的研究和应用领域, 从20世纪90年代至今, 在全球掀起的建设数字图书馆的浪潮, 就是信息技术与图书馆事业充分结合的综合体现。随着信息技术的不断更新、数字图书馆理论研究的逐步深入和数字图书馆应用经验的广泛积累, 数字图书馆正经历着“以资源为中心, 向以服务为中心到以用户为中心”的演变过程[1]。
数字图书馆己经经历了基于数字化资源的第1代数字图书馆, 现在正由基于集成信息服务的第2代数字图书馆向基于用户信息活动且以门户作为表现形式的第3代数字图书馆转变[2]。
国际上对数字图书馆门户的研究从20世纪90年代末开始。早在1999年ARL-OCLC重要问题论坛 (ARL-OCLC strategic Issues Forum) 上, 就“避免Web环境下商业信息服务争夺图书馆用户”的问题, 与会者提出必须着手“研究型图书馆在Web上的集中呈现方式”的研究。NSDL将选定一种主门户 (Portal) 作为用户到NSDL存取资源及享用服务的入口, 因此对门户也进行了很多研究, 包括对门户的类型、组成元素、页面流程、服务方式等都做了各种规范[3]。国家科学数字图书馆CSDL于2001年12月正式启动面向科技用户的、分布的、可集成定制的信息服务。CADUS除建立中国高等教育数字化图书馆中心门户外, 还根据学科和地区分布, 建立了三级体系中心门户, 包括四个全国中心门户, 八个地区中心门户, 15个省中心门户。各中心采用CAUS统一的门户系统, 统一检索系统, 参考咨询系统, 馆际互借系统来建立自己的数字图书馆门户。本文针对图书馆用户的行为分析, 提出了基于用户行为分析的图书馆数据库资源整合与利用的整体框架, 进行了用户行为数据的分类和用户行为数据的挖掘, 最终给出了图书馆数据库资源整合与利用的发展方向。
1 基于用户行为分析的资源整合与利用方法
1.1 用户行为分析方法
通过计算机的相互关联进行决策和信息的分析处理, 是跟随着信息技术和计算机网络的发展而发展起来的。计算机技术的发展在对高级信息的处理上已经变得举足轻重了。仅仅海量信息的收集、存储和管理就需要花费很大的物力和人力, 因此要想从这些海量的信息中, 得到我们所需要的知识和内容, 就要付出得更多。数据挖掘技术是在20世纪80年代中后期, 随着数据仓库和相应的数据库知识发现 (KDD) 等数据库信息处理技术而不断出现的[4]。用户对数据库中数据的利用方式因此而改变, 这也将成为将来非常重要的数据信息处理技术。近年来, 数据库资源的整合有了飞速的发展, 随着数据库资源整合的发展, 数据挖掘技术在数据库资源的整合中被不断引入, 主要针对数据库资源进行用户行为的分析处理。举例来说, 30~60岁以上教师, 最关注的书目类别是与本专业有关的书籍;60岁以上的退休教师对理财类、文史类的书籍比较关注, 而处于30以下的学生对娱乐、体育、考试之类的书籍比较关注。
1.2 数据挖掘
数据集被采集到之后, 从中发现有用的、全新的、过程可理解的和有一定规律的信息的过程, 就称之为数据挖掘就。数据挖掘是隶属于数据库中知识发现的重要步骤。随着知识爆炸时代的来临, 如何解决日益增长的海量数据并从海量数据中, 获取我们需要的知识信息是数据挖掘技术的内容。通过数据挖掘中的算法分析与应用, 可对大量数据进行分析并从中发掘有用的数据信息[5]。
数据库中知识发现过程如图1所示。
数据库数据的准备, 对数据库中数据的挖掘及对数据库中数据挖掘结果的解释与评估是数据库中知识发现过程的三个阶段。
1) 数据准备
对数据库中所有数据的挖掘过程中, 占比最大的是数据的准备工作。其占比达到60%。这个阶段的主要任务就是形成目标数据。具体过程就是: (1) 对数据库或数据仓库中已经存在的数据的分析, 并根据需要提取所需要的数据; (2) 数据再加工, 从数据仓库或数据库中选择之后的数据, 需要经过进一步的加工, 最终才能作为数据挖掘的入口数据[6]。
2) 数据挖掘算法
首先, 进行数据挖掘算法的确定, 结合数据库中知识发现要处理的数据的不同类型, 从分类挖掘、回归挖掘、关联挖掘等方法中进行适合本数据类型的数据挖掘方法的选择并以此进行算法的规划。其次, 是数据处理算法的确定, 并根据选择的处理算法, 进行最优的数据处理模式和处理参数的设置。上述步骤完成之后, 运行该模块, 就可以从大量的数据信息中, 挖掘出对我们有用的重要信息[7,8]。
本文采用UNC的层次聚类算法 (L—UNC) :
Step1确定种群大小, 后代个数, 和最大迭代次数L
Step2设置初始种群L=1, 聚类|C (i-1) |=1
Step3设置初始数据聚类方案:X (l-1) =X (l-1) , 1=X
Step4设置集合最初形式:C (l-1) =Ф, 设置确定的原型集合P=Ф
Step5初始集合方差
Step6调用聚类递归函数 (l-1)
Step7把类X中所有数据都分入原型Pi∈P
Step8重新计算δ*2i和N*i
本文的聚类递归函数采用 (X (l-1) , C (l-1) , ∑ (l-1) , l) :
3) 数据挖掘结果的解释与评估
针对数据挖掘的结果并结合最终的决策目标, 对获取的相关数据信息进行特定的分析与处理, 提取出我们最关心的知识信息。并将上述结果提交给用户做最终的处理。用户由于先验知识的不同以及自身的知识水平的差异, 因此对数据挖掘结果的展示要考虑简单化的模式和挖掘结果的可视化。以使得最终的结果可以直观明了地被用户所掌握和应用。如此反复不断地进行数据挖掘操作, 才能把最有用的信息呈献给用户[9,10]。
2 基于用户行为分析的数据库资源整合与利用的框架
2.1 基于用户行为分析的图书馆数据库资源整合框架
如图2所示的几个层次的内容构成了图书馆的数据库资源。
本文针对图书馆数据库资源整合与利用的需求, 提出如图3所示的基于用户行为分析的图书馆数据库资源整合与利用的整体架构。
图4是图书馆数据库资源整合的基本用例图。
基于用户行为分析的图书馆数据库资源的整合与利用的用例图主要包括:系统设置、读者管理、图书管理、图书借还、系统查询、用户行为分析等6个用例。其中, 系统设置主要针对用户的访问权限, 用户的角色, 数据库备份周期等进行管理;读者管理主要针对所有的读者, 包括:学生、教师、家属等的读者注册, 读者登录的管理;图书管理主要针对图书馆所有图书的管理, 包括目录管理, 条形码管理, 档案管理, 光盘管理等;图书借还主要针对读者借阅图书和归还图书的管理;系统查询实现对图书的查询, 对光盘信息的查询, 对新书的查询等;用户行为分析, 主要针对数据获取, 数据预处理, 数据挖掘等的管理。
2.2 用户行为分析模块
为实现基于用户行为分析的图书馆数据库资源的整合与利用平台的目标, 达到资源的合理配置和高效整合, 对用户访问数据进行数据挖掘, 通过数据挖掘结果开发的图书馆数据库资源的整合与利用平台的受欢迎程度得以充分认识、明确了用户的访问偏好和习惯性动作, 可对平台的流量进行分析并给出了平台的未来发展规划, 进一步的评测该图书馆数据库资源的整合与利用平台成功与否。针对平台存在的问题, 进行针对性的查找, 进而更好地为用户提供服务。
用户行为分析管理模块将包括3个部分:数据获取模块、数据预处理模块、数据挖掘模块。各部分的关系如图5所示。
(1) 数据获取模块。获得访问者的访问记录信息是数据获取模块的最主要功能, 访问者的记录信息主要包括:浏览时间的长短、所浏览的网页地址信息、所有浏览的网页内容等, 通过爬虫程序在较短时间内, 即可获取大量的数据信息。
(2) 数据预处理模块。提供对获取的用户访问数据的整理、把无关的内容或明显不对的数据去除掉, 以便得到更加准确的数据挖掘结果。
(3) 数据挖掘模块。提供对各种用户的访问记录、访问时间、访问内容及用户的分类、用户的信息等的统计分析及挖掘功能。得出用户的偏好信息, 并进行结果的展示, 为平台更好地为用户服务提供改进建议。
图书馆数据库资源整合与利用平台用户行为分析模块的活动图, 如图6所示。
具体步骤描述如下:
Step1进行图书馆用户登录信息的数据采集;
Step2采集数据与数据库信息进行匹配, 查看是否有相符合的记录;若无相符合的记录, 则进行提示, 转Setp1, 并重新进行数据采集;若有相符合的记录转Step 3;
Step3采集数据的预处理, 整理获取到的用户访问的数据信息, 把无关的内容或明显不对的数据去除;
Step4通过整理完成的数据进行用户行为特征的选择, 分析与挖掘;
Step5判断是否挖掘成功, 若成功转Step6;否则, 转Step1;
Step6数据挖掘结果的应用, 将挖掘结果应用到系统设置, 读者管理, 图书管理, 图书借还, 系统查询等各个模块, 使得上述模块的设置与展示根据用户的行为特征进行;
Step7判断应用是否成功, 若应用成功, 则转Step 8;否则, 转Step6;
Step8结束。
3 基于用户行为分析的图书馆数据库资源整合与利用的实现
伴随着Internet技术的飞速发展, 特别是信息技术的广泛应用, 各种类型的图书馆数据库资源整合也在近几年取得了较快的发展[11]。当前, 各图书馆的系统设置、读者管理、图书管理、图书借还、系统查询均存在不合理的地方, 本系统基于用户行为分析的结果进行重新的整合与利用[12]。
系统主界面如图7所示。
图书馆首页展示的是借阅排行榜, 可以清楚地展示用户最喜欢的图书是什么类型的, 浏览量最大的是哪些图书。当读者需要借书时, 管理员输入读者的相关信息, 进行搜索, 显示出读者相关信息后, 再输入图书的条形码进行搜索, 然后单击借书的链接, 将调用图书信息表, 将图书信息表中图书的条形码, 图书名称和读者信息表中读者条形码和读者名称添加到图书借阅信息表中。此时图书借阅信息表中将增添一条新的图书相关记录。
图8所示的用户行为分析模块为实现基于用户行为分析的图书馆数据库资源整合与利用, 达到资源的合理配置和高效整合, 对用户访问数据进行数据挖掘, 通过数据挖掘结果整合的图书馆数据库资源的受欢迎程度得以充分认识、明确了用户的访问偏好和习惯性动作, 可对平台的流量进行分析并给出了平台的未来发展规划, 进一步的评测该数据库资源整合成功与否。针对图书馆数据库资源存在的问题, 进行针对性的查找, 进而更好地为用户提供服务。
为试验L-UNC的有效性, 我们从学校网站12天的访问日志中抽取出1 712个会话和380个URL。参数取值为δ2max=0.96, δ2split=0.3, Nsplit=30。L=1时的用户行为特征如表1所示。
从表1可看出, L-UNC能有效地抽取出用户特征。δ*2i越低, N*i越高, 用户特征就越明显:特征1可以看出是大一新生用户, 特征2可以看出是博士在读用户, 特征3可看出是硕士、大四学生用户, 特征4是大二学生用户, 特征5可以看出是退休教职员工用户。
4 结语
基于用户行为分析的图书馆数据库资源整合与利用实现了该图书馆管理系统中系统设置、读者管理、图书管理、图书借还、系统查询等的基于数据挖掘的有效管理, 是对图书馆数据库资源进行重新整合展示的平台。基于用户行为分析的图书馆数据库资源整合平台对应的众多用户可以登录该系统进行所需图书、光盘的借阅、搜索、浏览等。基于用户分析技术, 采用直观的图形界面化展示, 用户可以很容易找到自己所需要的资料, 并对已借阅的未归还的图书进行方便的管理。基于用户行为分析的图书馆数据库资源的整合与利用将是图书馆日常管理中的重要补充, 可为广大用户提供更好的、更快捷的服务。
摘要:图书馆数据库资源的网络化、数字化和资源共享共建化是现代图书馆学的发展方向。数据库资源的整合与利用是图书馆资源整合的核心与关键。针对图书馆用户的行为分析, 提出基于用户行为分析的图书馆数据库资源整合与利用的整体框架, 进行用户行为数据的分类和用户行为数据的挖掘, 最终给出图书馆数据库资源整合与利用的发展方向。
关键词:用户行为分析,图书馆,数据库,资源整合,利用
参考文献
[1]李大伟.数据挖掘在用户行为分析中的研究与应用[D].北京:北京邮电大学, 2009.
[2]DRNadeau.Building virtual worldswith VRML[J].Computer GraPhics and Applications, IEEE, Mar/Apr 1999, 19 (2) :18-29.
[3]陈都.基于用户行为的智能搜索研究[D].北京:华北电力大学, 2008.
[4]李金秀.我国网络信息用户基本情况调查[J].广东行政学院报, 2005 (4) :92-96.
[5]郑雯译, 毕艳芳.论高校国书馆对网络原生数字资源的整合[J].图书馆论坛, 2012, 32 (1) :94-99.
[6]Marie-Christine R, Chantal R.Knowledge representation for information integration[J].Information Systems, 2004, 29 (1) :3-22.
[7]李明理.数字图书馆信息资源建设模式转型策略探讨[J].图书馆论坛, 2012, 32 (4) :84-90.
[8]袁豪杰.数字图书馆可持续发展中的信息资源建设探索——以宁波数字图书馆为例[J].大学图书馆学报, 2011 (2) :72-77.
[9]张立春.基于数据挖掘技术的图书馆服务平台研究[J].图书馆理论与实践, 2012 (12) :35-38.
[10]冀振燕.UML系统分析设计与应用案例[M].北京:人民邮电B2C电子商务平台, 2004:136-177.
[11]周良华.网络时代高校图书馆流通管理工作中存在的问题及对策[J].重庆文理学院学报, 2013 (3) :151-153.
学生行为数据库 篇9
关键词:数据挖掘;数据仓库;寿险;决策树;C5.0
中图分类号:TP311文献标识码:A文章编号:1009-3044(2007)18-31481-03
Application of Data Mining Technology to Analyze Life Insurance Customers' Purchase Behavior
ZHANG Xiao-yan1,QI Chun-ying2
(1.Educational Information Technology Center,South China Normal University,Guangzhou 510631,China;2.Xuzhou TV University,Jiangsu 221006,China)
Abstract:With China's entrance to WTO, the competition of domestic life insurance market is becoming red-hot day by day.With two decades' development, our life insurance has achieved rapid progress and accumulated a large amount of data of their customers.To find the rule that the customers selected their life insurance policy.the data mining technology is used based on their purchasing records.Data deriving, data cleaning and data pre-processing are necessary steps before data mining. After that, decision tree models were set up with C5.0 algorithm in SPSS Clementine tool and different models were compared and analyzed to find out some useful rules in the customers' decision about different life insurance product..
Key words:data mining;data warehouse;life insurance;decision tree;C5.0
1 引言
1.1研究的背景和动机
随着计算机技术和信息技术的发展,信息的增长速度呈指数上升。有数据表明,进入二十世纪90年代,人类积累的数据量以每月高于15%的速度增加。面临浩瀚无际的数据,如果不借助强有力的分析技术,仅依靠人的能力来理解这些数据是不可能的,因此,人们需要强有力的数据分析技术来满足对海量数据分析的需求。在这种情况下,从数据库中发现知识及其核心技术——数据挖掘技术应运而生,并显示出强大的生命力。
寿险行业在我国虽然起步较晚,但自改革开放以来,寿险业在我国取得长足发展,每家寿险公司都积累了自己庞大的信息库,面对这些海量的数据,如何加以合理分析与利用,是每家公司急于要解决或正在解决的问题。基于这样的一个背景,本文提出了在寿险行业中应用数据挖掘的方法对客户对寿险产品购买行为进行分析的研究
1.2研究现状
国内的寿险业经过近二十年的发展,积累了大量的客户数据和代理人数据,目前国内的各大寿险公司已经从数据仓库着手,建立自己公司的BI系统,从目前的规模、IT人员技术的积累、市场竞争的加剧等客观情况来看,数据挖掘在寿险业的应用的时机和条件都日趋成熟,只是在目前的条件下,数据挖掘在寿险行业的成功应用并不能一蹴而就,而需要一个循序渐进的过程。
1.3寿险行业数据挖掘应用范围
在寿险产品的销售过程中,一共有四种角色参与:投保人和被保人、寿险代理人和保险人,其中投保人与被保人都称作公司的客户,数据挖掘在寿险业的应用范围非常广泛,具体包括以下方面:
对客户而言,数据挖掘的应用范围主要包括:客户利润分析、客户生命周期价值分析以及客户聚类分析;
对代理人而言,数据挖掘的应用范围主要包括:为代理人队伍的正确部署准备决策依据和潜在优秀代理人的发掘;
对保险公司而言,数据挖掘的应用范围主要包括:风险模型的建立和索赔分析;
2 数据挖掘技术及其现状
2.1数据挖掘的概念
数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。这些数据可以是结构化的,如关系数据库中的数据,也可以是半结构化的,如文本,图形,图像数据,甚至是分布在网络上的异构型数据。发现知识的方法可以是数学的,也可以是非数学的,可以是演绎的,也可以是归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等,还可以进行数据自身的维护。数据挖掘借助了多年来数理统计技术和人工智能以及知识工程等领域的研究成果构建自己的理论体系,是一个交叉学科领域,可以集成数据库、人工智能、数理统计、可视化、并行计算等技术。
2.2数据挖掘的主要步骤、任务、方法和应用
数据挖掘一般有以下几个主要步骤:数据收集、数据整理、数据挖掘、对数据挖掘结果的评估以及最终的分析决策。数据挖掘过程需要多次的循环反复,才有可能达到预期的效果。
数据挖掘技术的目标就是从大量数据中,发现隐藏于其后的规律或数据间的关系,从而服务于决策。
数据挖掘主要任务有:数据总结、分类、关联分析和聚类分析。
数据挖掘工具采用的主要方法包括决策树、相关规则、神经元网络、遗传算法,以及可视化、OLAP联机分析处理等,另外也采用了传统的统计方法。
目前,数据挖掘的研究和应用非常热门,应用主要集中在以下几个领域:金融、市场业、工程与科学研究、产品制造业、司法和证券业。
2.3数据仓库与数据挖掘
数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。数据仓库本身是一个非常大的数据库,它储存着由组织作业数据库中整合而来的资料,特别是指从联机事务系统OLTP(On-Line Transactional Processing)所得来的资料。企业数据仓库的建设,是以现有企业业务系统和大量业务数据的积累为基础,整个数据仓库系统包含四部分:数据源、数据的存储与管理、OLAP服务器和前端工具。
数据挖掘是在数据仓库的基础上进行的,若将数据仓库比喻作矿坑,数据挖掘就是深入矿坑采矿的工作,若没有够丰富完整的资料,是很难期待数据挖掘能挖掘出什么有意义的信息的。
3寿险客户购买行为数据集市设计
3.1数据集市总体结构和开发模型
在多年开发和维护寿险客户分析系统的基础上,为了减少开发与维护的工作量,同时为了在客户的购买行为上开展数据挖掘,作者决定在SQL Server数据库上通过对业务数据的抽取、清洗与转换,建立有关客户购买行为的数据集市,并通过建立多维数据集,对不同的决策层采用不同的工具展示他们所需要的数据,其总体结构如图1所示:
图1 数据集市总体结构
本文的实验是采用数据集市(Data Mart)的形式。数据集市开发模型的建立如图2所示:
图2 数据集市开发模型
4 客户购买行为的决策树分析
4.1数据预处理
4.1.1数据抽取
总公司可以直接从数据库中提取数据,分公司则采用了微软的DTS(数据转换服务),通过定义一个源数据端和一个目的数据端,通过DTS在两端之间传输数据。建立好抽取的模型后,再用SQL Server的企业管理器,定义作业,指定每天凌晨定时从总公司的业务系统里取数据。
4.1.2数据清洗
寿险业的数据与其他数据一样,常常是含有噪声、不完全和不一致的,数据预处理能够帮助改善数据的质量,进而帮助提高数据挖掘进程的有效性和准确性。
对数据的清理,主要包括一下几个方面:遗漏数据清理、噪声数据处理和错误数据处理。
4.1.3数据转换
(1)日期的转换
在业务系统上,日期都是用数值型表示。对于生效这类日期是以8位的数值表示,如20040101,而对于客户的出生日期是用5位数值表示,如20040101表示为40101,所以在向数据装载数据之前,需要把这两类日期表示方法进行统一处理,如把40101作如下转换:40101+20000000 = 20040101
(2)保费的转换
对于寿险产品,缴费方式分为年缴与趸缴,趸缴是一次性缴完所有保费,所以趸缴保单的保费是远远大于年缴保单的。而年缴保单不同的缴费年期的缴费金额也不同的。而对于寿险公司来讲,对这些保单的管理的投入也是不同的,所以通常会对这些单做标准保费的转换。
对于年缴保单,标准保费是一倍自然保费的,对于趸缴保单,标准保费是等于自然保费的10%。
4.2 数据分析与数据展示
对于公司不同层级的决策层,由于使用电脑的频率不同,采取了不同的展示方法,对于中层的决策层,由于使用电脑机会较多,通过多维数据模型,向他们展示不同维度的数据分析。维度是经过对业务部门需求分析得出的,下例是分成三个维:
时间维:表明该保单同意承保日期
险种维:根据被保险人所购买险种类型归类的层次结构
区域维:对各分支机构进行归类的层次结构
多维数据集的数据展示如图3所示:
图3 营销数据的多维分析
4.3 数据记录的选取
根据预处理后的数据,可以从中得到被保险人的详细资料,包括被保险人的年龄、性别、家庭年收入、职业、婚姻状况、学历及所购买的寿险产品代码等,其数据片断如图4所示。
其中的职业分类(典型职业):1表示普通文员,2 表示外务员,3表示司机,4表示厨师,5类表示采矿工人,6类表示伐木工人。由于客户在选择寿险产品的时候,主要是看它的主险部分,而且无论从保费还是从保障来讲,都是主险占绝对影响力,而且在寿险公司对保单的件数的统计都是以主险为单位的,而不考虑附加险。所以对于客户对险种的选择,只选取了以主险为单位的那些记录。这样,结合被保人与客户对主险的选择一共有24736条记录。
图4 所选择的数据片段
4.4决策树模型的建立
按照保险对象来分,分为人寿险、健康险和意外险三类。由于意外险的在我们公司是以卡单的形式存在的,没有特定的主险形式,所以我们对这些单分成两类。这种分类方法是从保险专业的角度来讲的,所谓人寿保险就是仅以人的生命为保险对象,以人的自然生死为保险金给付责任的人身保险。健康保险是以人的身体或生理机能为保险对象,以疾病或意外伤害事件所致的医疗费用支出或收入损失为保险责任的人身保险。我们公司的健康险包括三个险种:D01P、D05P和P01P,这几款险种的特点是全消费型,而且比较贵,都是对重大疾病的保障。按此类方法,我们把健康险定为A类,非健康险分为B类,记录片段如图5所示。
图5 分类数据片段
记录分布如图6所示:
图6 记录分布
分类的决策树模型如图7所示:
图7 分类的决策树模型
决策树产生的分类规则如图8所示:
图8 决策树产生的分类规则
4.5结果分析
从分类产生的结果来看,可以明显看到以下规则:
(1)年龄在17岁以下和45岁以上的客户购买健康险的比率较少:
分析:对于17岁以下的那些客户,由于本身罹患重大疾病的机率较小,而国内的寿险客户在选择寿险产品的时候多从自身所处的情况出发,对周围比较容易发生的风险比较关注,而对离自己较远的那些风险则是相对关注较少,所以这类客户多数是不考虑购买重大疾病的保险。而对于年龄45以上的那些客户,考虑到费率的原因,这类客户在这个年龄段购买重大疾病保险费用高,举例来讲,对于一个25岁的健康男性,如果购买保额为1000元的重大疾病保险,按20年缴,只需要33元/年,而同样的保额对于一个45岁的人来讲,则需要56元/年,所以多数客户如果要选择健康险,都是趁比较年轻时费率相对较低的时候购买,而不会在上了一定年纪后费率较贵的时候购买。
(2)对于在17岁到45岁之间的客户,是否购买健康险首先是由其家庭年收入多少决定,对于年收入在41000元以下的那些客户较少选择健康险,分析其原因是与健康险本身的特点有关,前面已经分析过,这三款健康险都是纯消费型的产品,既没有储蓄的性质,也没有投资的性质,也就是在保障期满,所缴纳的保费是没有返还的,而一般的人寿险特别是养老型的险种都具有一定的储蓄性质,就算是纯保障的产品,也会相对比较便宜。所以对于家庭年收入较低的家庭,考虑健康险的也比较少。而对于这个年龄段的客户,如果收入在41000元以上的家庭,职业类别是1类和2类的,也就是那些办公室文员、行政内勤、商店经营人员选择健康险的比较多,分析这类人员的特点多为企事业白领阶层,工作紧张压力大,平时活动和运动量都相对较少,但是对自身的身体健康却非常在意,而不太看重保险的投资与养老的功能,所以这类人更多会选择健康型的险种。
(3)对于三类职业,结果中没有明显的规则发现,但是异常数据比较多,共9287条记录,占总数的35%,而第3类职业在我们的职业分类表里,多为司机类职业。由于寿险公司在对被保险人的风险类型进行评估的时候,如果出现多个类型,是取高风险的职业类别。因此要根据该类客户所从事的职业进行进一步分析,如从事的职业是与驾驶车辆有关的职业,则购买健康险的客户比较多,否则,符合前两类分析结果。
5 总结
本文在数据挖掘理论研究的基础上,利用数据挖掘的决策树的方法,对寿险公司客户在选择寿险产品的规则上进行了分析与研究。较为系统性地研究了数据挖掘方法在寿险客户购买行为分析上的应用。提出并建立了我公司寿险客户产品选择的决策树模型,以便能对寿险代理人在展业过程中,有针对性地为客户设计寿险计划有所帮助。
参考文献:
[1]Jiawei Han,Micheline Kamber.Data Mining Concepts and Techniques[M].San Mateo:Morgan Kaufmann Publishers Inc,2001.
[2]Microsoft Corporation(Microsoft SQL Server 7.0的经典指南分析服务})[M].北京:清华大学出版社,2001.8.
[3]Jiawei Han Michaline Kamber(加)范明,孟小峰.等.译.数据挖掘概念与技术[M].北京:机械工业出版社,2001.8.
[4]朱明.数据挖掘[M].北京:中国科学技术大学出版社,2002.5.
[5]飞思科技产品研发中心.SQL Server 7.0 OLAP服务设计与应用[M].北京:电子工业出版社,2002.1.
[6]郑纬民,黄刚.数据挖掘工具及其选择.计算机世界,1999年第20期.
[7]单承戈.决策支持系统问题模型的可视化构造方法[J].计算机应用研究,2000,23(9):25-27.
基于大数据的网络用户行为分析 篇10
互联网和云计算技术的飞速发展, 促使行业应用产生的数据呈爆炸性增长, 数据量的快速增长标志着人类已经从信息时代步入大数据时代。目前, 百度的总数据量已超过1000PB, 每天需要处理的网页数据达到10PB—100PB;淘宝累计的交易数据量高达100PB;Twitter每天发布超过2亿条消息;新浪微博每天发帖量达到8000万条;中国移动单独省份的电话通联记录数据每月可达0.5PB—1PB;单独省会城市公安局道路车辆监控数据三年可达200亿条、总量120TB。据世界权威IT信息咨询分析公司IDC研究报告预测:全世界数据量未来10年将从2009年的0.8ZB增长到2020年的35ZB (1ZB=1000EB=1000000PB) , 10年将增长44倍, 年均增长40%[1]。大数据悄然地改变着我们的工作和生活方式, 同时对于企业经营运作模式的创新更是一个机遇和挑战。
2 大数据概述 (Summary of Big Data)
2.1 大数据的定义
大数据的概念出现较早, 2008年, 美国《Nature》杂志在Google成立10周年时出版了“Big Data”专刊, 该专刊主要探讨未来大数据的处理技术和问题, 并对大数据与一些行业可能存在的关系进行了介绍[2]。2011年5月, 麦肯锡咨询公司发布了名为《大数据:创新、竞争和生产力的下一个前沿领域》报告, 报告中表示大数据已经成为现代社会必备的生产要素, 数据与各个行业的密切相关, 大数据将促进未来生产率的提升。
但是, 对于大数据的具体概念, 行业研究者和学者给出了不同的定义。维基百科对大数据的定义为:大数据是指无法使用传统和常用的软件技术和工具在一定时间内完成获取、管理和处理的数据集[3]。美国权威IT研究与咨询顾问公司Gartner认为大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。可见, 大数据技术的战略意义不在于掌握庞大的数据信息, 而在于对这些含有意义的数据进行专业化处理。
2.2 大数据的特点
对于数据的特点, IBM总结为3V, 即Volume (海量性) 、Variety (多样性) 和Velocity (高速性) 。随着对大数据的研究的深入, IDC将IBM提出的3V进行了发展, 提出4V特性, Volume (海量性) 、Variety (多样性) 、Velocity (高速性) 、Value (价值性) 。
(1) 海量性, 就是数据体量巨大。从TB级别, 跃升到PB级别。
(2) 多样性, 就是数据类型繁多。如网络日志、网络新闻、网络购物和地理位置服务等都可以产生大量的文字、视频、图片和地理位置等各种类型的数据信息。
(3) 高速性, 即处理速度快, 大数据技术可从各种类型的数据中快速获得高价值的信息, 这一点也是大数据技术和传统的数据挖掘技术的本质不同。
(4) 价值性, 只要合理利用大数据, 并对其进行正确和准确的分析, 将会带来很高的价值回报。
3 分析网络用户行为的必要性 (Analysis of thenecessity of network user behaviors)
网络用户行为是指用户在使用网络资源时所呈现的规律性。这通常是通过对有关用户使用网络资源的数据进行记录、统计和分析所得出。用户在使用网络资源时, 用户行为可以分为信息查询行为、沟通交流行为、休闲娱乐行为、电子服务行为和电子商务服务行为等许多方面。互联网技术和大数据技术的发展, 使用户对网络服务质量的要求逐步提升, 网络服务提供者提供服务的方式也逐渐走向科学, 通过对网络用户行为的分析和规律总结, 可以将这些规律与产品或服务的经营策略相结合, 发现目前经营服务中的问题, 并为进一步提高服务质量和经营策略的制定都有非常重要的意义。
4 大数据与网络用户行为分析 (Big Data and theanalysis of the network user behaviors)
4.1 网络用户行为的界定
从大数据的视角进行网络用户的行为分析, 首先要重新界定网络用户行为的组成。
(1) 用户群特征分类。对网络用户群进行分类, 不同于以往的单一根据年龄或职业等进行分类, 要从不同维度, 先测得用户的行为数据之后, 在进行细化分类。
(2) 用户对产品的使用率。对于网站类产品, 主要有网站的点击率、访问量、访问率、点击量、页面停留时间、访问模块数等;对于网络购物类产品, 包括访问量、访问率、咨询率、转化率、二次购买率和推荐率等;对于移动应用类产品则体现在下载量、使用频率和使用模块数等。
(3) 用户使用产品的时间。就是用户每天在什么时候会使用该产品, 比如对于微信的公众号信息推送模式, 就必须了解大部分用户会点击打开该公众号内文章的时间, 以避免对用户的打扰, 提高推送信息的到达率。
4.2 网络用户行为分析方式
收集到了网络用户行为的大数据之后, 需要对用户进行分析, 主要分析方式有以下几种:
(1) 以数据分析为导向。以数据分析为导向是指在大数据分析过程中, 通过收集相关数据做出下一步用户推荐服务等设计。如电子商务网站上的相关推荐和你可能喜欢等, 这些数据可以微精准营销提供数据支撑。
(2) 以产品设计反馈为导向。以产品设计反馈为导向是指通过数据监测、挖掘、收集、整理和统计用户数据, 为产品设计或改进服务的大数据分析。如收集用户属性和用户习惯数据, 用户属性是用户的基本信息字段, 包括性别、年龄、地域和网龄等传统信息, 倾向于用户群体分类;用户习惯包括用户的访问偏好、访问时间、流量习惯等。
(3) 以用户调查为导向。以用户调查为导向, 倾向于基础数据的分析, 如用户基本动作分析可以从用户在网站或页面的停留时间、访问量和用户活跃度等方面入手, 通过对用户的使用频率进行分析, 可以得出为什么用户喜欢使用该产品的这个功能。
4.3 实证研究
目前, 对于网络用户行为分析应用主要集中在电子商务领域, 在电子商务领域用户信息行为的数据量极大。据电子商务行业的用户行为分析公司的不完全统计显示, 用户在购买产品之前, 平均要浏览与该产品相关的5个网站和36个页面, 同时产生在社会化媒体和搜索引擎上的交互行为也多达数十次。电子商务领域的基于大数据的用户行为分析, 可以帮助电子商务企业更好地为用户开展售前、售中和售后服务。
本文以国内的某团购网站为例, 分析该网站在网络用户行为分析中的大数据应用。该团购网站的移动端APP主界面配置的服务主要有:搜索服务、LBS (基于位置的服务) 、产品服务分类和猜你喜欢等。其中的猜你喜欢属于推荐服务类是根据用户的以往购买行为和区域特点进行的精准推荐服务。下面以一名用户的使用团购APP为例, 进行用户行为分析。
用户的购买前行为信息, 可以反映出用户的购买心理和购买意向。用户A在打开团购APP的100次中有78次直接选择了主界面的美食分类, 10次选择今日新单分类, 9次选择电影分类和3次选择KTV分类。在进入美食分类后, 用户A直接选择了智能排序中“离我最近”选项有52次, 人气最高有10次, 评价最高有10次, 价格最低6次。用户A在选择“离我最近”的选项中, 有40次在同一地点, 有8次在另一个地点, 有4次在其他不同位置。用户A在选择了“离我最近”之后筛选出附近的美食, 在该页面平均停留320秒, 之后才会在美食下的菜系分类中进行二次筛选。在菜系筛选中, 用户A选择火锅14次、川湘菜15次、西餐10次、京菜鲁菜15次、烤肉烤鱼11次和中式烧烤8次等。用户A在点击某款美食打开团购详情时, 在团购详情页面平均停留20秒、在图文详情平均停留28秒, 评价页面平均停留90秒。用户A在78次浏览美食分类中, 有16次购买行为, 在16次购买行为中, 从打开团购APP到下单购买时间为78秒。
通过对用户A在团购APP中的行为数据分析与其他用户对比可知, 用户A使用团购APP的主要目的为浏览美食和团购美食, 用户A口味倾向传统鲁菜菜系和川菜菜系, 在进行选择餐饮商家的时候, 倾向于选择距离自己位置近或者住宅附近的商家, 用户A对价格不是特别敏感, 更加注重商家位置, 其次是人气和口碑, 用户A在具体进行商家选择时, 更加注重其他用户的评价, 但是一旦决定购买, 下单购买行为较快。所以, 对于此类用户, 团购APP在主界面中的“猜你喜欢”中展示的信息应为美食类, 且距离该用户常用位置近的鲁菜和川菜美食, 这样能提高用户的体验和消费次数, 同时在支付环节应尽量选用成熟的第三方交易平台, 能使该用户支付行为更加果断。
5 结论 (Conclusion)
综上所述, 大数据技术和互联网用户行为分析日益密切融合, 将传统的产品设计、营销和经营管理彻底改变。大数据作用的日益凸显更要求互联网企业和传统企业能够正视大数据的作用, 对大数据的应用要结合自身情况, 切不可盲目跟风。
参考文献
[1]黄宜华.深入理解大数据:大数据处理与编程实践[M].北京:机械工业出版社, 2014.
[2]Nature.Big Data[EB/OL].[2014-08-31].http://www.nature.com/news/specials/bigdata/index.html.
相关文章:
国有大型煤矿企业02-18
师德师风总结二02-18
高中毕业证鉴定02-18
肖尔布拉克镇小学实施方案02-18
事业单位会计个人总结02-18
关于教育强镇工作实施方案02-18
米歇尔奥巴马北大演讲稿中英对照02-18
大班数学案例分析02-18
奥巴马演讲全集(中英对照)02-18
城建档案鉴定销毁制度02-18