图书推荐系统(精选十篇)
图书推荐系统 篇1
1 推荐系统的概念
一般情况下,用户会根据自身需要,通过搜索引擎来查找,但有些时候,用户给出的关键词语并不能诠释自己需要的图书类别的资料的内容,这就很容易造成检索结果给出的资料与用户的实际要求不相符的情况,这就需要在检索系统当中增添推荐系统,以便更好的为用户提供服务。其次,当读者通过该系统输入关键词时,系统现给读者。
2 图书推荐技术设计
当前,图书馆的检索推荐方式分为两类,一类是图书馆内的管理人员协助读者检索推荐;另一类是读者通过自己总结出的关键词,借助图书检索系统的推荐技术进行关键词的检索。从当前图书出版业与图书馆的发展形势来看,这两类检索方式都不符合图书馆建设人性化、个性化信息服务的要求。因此,要对图书推荐系统进行重新设计。
2.1 系统总体设计
随着电子商务的不断发展,网上书店也随之兴旺起来,其中,其当当网、China-Pub、卓越网等知名网络书店都使用了推荐技术,帮助用户快速购书。虽然现在的图书馆也在使用推荐技术,但是在图书内容的相关性上要弱于网上书店,因此,本文结合网上书店的推荐技术,将图书推荐系统分四个板块进行设计。首先,对网络书店中图书的数据进行采集,在分析出该店半结构化的网页源码后,得出相关的有效数据,并根据其中的有效数据设计出专用的爬虫,将数据导入到图书馆的数据库中。然后,利用Book Rank计算技术算出每一本图书Book Rank数值,为后续推荐系统模块的图书排序提供有效的数据,防止在排序上出现数值误差。最后,设计出符合该系统的两个推荐策略。
2.2 数据库设计
推荐系统的设计需要大量的数据做辅助,为了使图书馆的图书推荐系统能够更好的与网上的半结构化的网页源码数据相结合,使其能够更好的贴合图书馆数据库系统,就需要对图书馆的数据库系统进行合理设计。首先,对当当网、China-Pub和卓越网这三大网站提供的数据详细分析,找出图书数据来源等问题,在确定了这一系列数据来源的基础上,设计图书数据库。图书数据库各类图书关系的设计主要分为三大类:一是图书的隶属关系,其关系从大到小排列为图书主分类 - 分类名称 - 上一级分类;二是表示图书现有数量的分类,分类主要包括,图书主分类以及各类图书数量两大方面。
3 图书推荐策略
3.1依照关键词
该方法主要为了解决当前图书馆检索系统在检索关键词时,只会将与关键词相关的图书检索出来,没有进行分类,用户查找不便,关键词推荐策略是针对当用户在检索系统中输入关键词得到信息时,推荐系统会根据图书的类别进行分类统计,并依据个类别的现有数量,合理的分配不同类别推荐的图书数目。同时,依据BookRank值来从推荐的数目当中进行图书的选择、汇总和排序。
3.2 依照特定图书
当读者选择某一本书时,图书推荐系统会根据该图书的相关分类信息向读者推荐同类图书。这一设计思路主要是:当读者选择此本书籍时,他可能会对同类图书也感兴趣,由此推理出其需要的书籍可能在同类的图书当中,于是便将该类别的图书作为推荐目录。
图书数据库是将图书按照树状结构进行分类的,总目录是该树状结构的基础部分,其目录名即为分类号,子目录是该树状结构的中间点,而图书则是该树状结构的叶子部分。该方法的特点是,当读者选取的目录中图书数量较少或者没有该类图书时,读者可以扩大目录选级,从而有效的弥补当前图书推荐系统,推荐数量不足的现状,扩大目录范围,为读者提供更多的选择。具体流程如图1所示。
4 结 语
图书推荐系统 篇2
本书目按0-3岁、4-6岁、7-9岁、10-12岁四个年龄阶段划分,每段推荐25本(基础书目10本,选读书目15本),这100本书主要参考了中国最具影响力的研究和推广阅读的公益机构新阅读研究所组织评选的中国幼儿基础阅读书目(2012版)、中国小学生基础阅读书目(2011版)、2013年中国童书榜、新闻出版总署向青少年推荐的100种优秀图书、接力出版社推荐书单以及全国小学著名语文特级教师窦桂梅推荐的书单等。
阅读年龄(0-3岁)——基础部分(10本)
《波波去购物》(“小鼠波波“系列)【英】露西·卡曾斯(著),启鸣(译)中华民族摄影艺术出版社
《大象杂技团》(“乐悠悠图画书”系列)【中】金波(文),钱继伟、大青(图)中国少年儿童出版社
《好饿的毛毛虫》
【美】艾瑞·卡尔(著),郑明进(译)明天出版社
《可爱动物操》 【中】方素珍(文),郝洛玟(图)河北教育出版社
《米菲住院》(“米菲绘本系列”)【荷兰】迪克·布鲁纳(著),阿甲(审译)人民邮电出版社
《米米爱模仿》(“米米系列”)【中】周逸芬(文),陈致元(图)河北教育出版社
《鼠小弟的小背心》(“可爱的鼠小弟“系列)【日】中江嘉男(文),上野纪子(图),赵静、文纪子(译)南海出版公司
《我要拉baba》(“噼里啪啦系列“)【日】佐佐木洋子(编/绘),张慧荣(译)二十一世纪出版社
《小玻在哪里》(“小玻翻翻书系列”)【英】艾力克·希尔(著),彭懿(译)接力出版社
《中国童谣》(“会说话的·点读识字读本”系列)
【中】金波(文),江键文(图)二十一世纪出版社
——选读部分(15本)
《爱米丽》(“爱米丽系列”)
【法】多米提勒·德·普桑斯(著),孙敏(译)
二十一世纪出版社
《蹦》
【日】松冈达英(著),蒲蒲兰(译)二十一世纪出版社
《藏猫猫》(“婴儿游戏绘本”)【日】木村裕一(著),崔维燕(译)接力出版社
《打预防针,我不怕》(“可爱的身体”系列)【日】小林雅子(文),冈边理香(图),猿渡静子(译)南海出版公司
《鳄鱼怕怕,牙医怕怕》 【日】五味太郎(著),上谊文化(译)明天出版社
《乔比洗澡》(“乔比洗澡书”)【法】提埃里·顾旦(著),荣信文化(编译)
未来出版社
《让我荡一会儿吧》(“小猫当当”系列)【日】清野幸子(著),猿渡静子(译)南海出版公司
《什么地方不一样》(“创意启蒙胶片书”系列)
【英】帕特里克·乔治(著)接力出版社
《谁咬了我的大饼》 【中】徐志江(著)《东方娃娃》编辑部
《我爸爸》 【英】安东尼·布朗(著/图),余治莹(译)河北教育出版社
《我不怕孤独》(“中国第一套儿童情绪管理图画书”系列)【新西兰】特蕾西·莫洛尼(著),萧萍(译)广州出版社
《我喜欢书》
【英】安东尼·布朗(著),余治莹(译)河北教育出版社
《小鞋子,走一走》(“幼幼成长图画书”系列)
【日】林明子(著),小林、小熊(译)少年儿童出版社
《小圆圆早上好》(“小圆圆”系列)【丹麦】汉娜·哈斯特鲁普(著),任溶溶(译)
二十一世纪出版社
《这是什么形状》(“小酷和小玛”系列)【日】秦好史郎(著),杨文(译)北京少年儿童出版社
阅读年龄(4-6岁)
——基础部分(10本)
《大头儿子和小头爸爸》 【中】郑春华(著)湖北少年儿童出版社
《带不走的小蜗牛》(“小蜗牛自然图画书系”)
【中】凌拂(文),黄崑谋(图)海燕出版社
《你一半,我一半》(“儿童多元智能绘本”系列)
【中】曹俊彦、陈木城(著)五洲传播出版社
《三只小猪的真实故事》 【美】乔恩·谢斯卡(文),莱恩·史密斯(图),方素珍(译)河北教育出版社
《数数看》
【日】安野光雅(著)接力出版社
《外婆桥》(“永远的儿歌小球听民乐”系列)【中】周逸芬(文),叶安德(图),陈中申(作曲)
河北少年儿童出版社
《武松打虎》(“京剧猫”系列)【中】熊亮(文),熊亮、吴翟(图)连环画出版社
《乡下动物园》(“中国绘”系列)【中】肖袤(文)、梁培龙(图)新世纪出版社
《雪人》
【英】雷蒙·布力格(著)明天出版社
《一本关于颜色的黑书》 【委内瑞拉】梅米娜·哥登(文),露莎娜·法利亚(图),朱晓卉(译)接力出版社
——选读部分(15本)
《点》
【加拿大】彼德·H·雷诺兹(著),邢培健(译)
南海出版公司
《菲菲生气了》
【美】莫莉·卞(著),李坤珊(译)河北教育出版社
《家里的安全》(“我的安全养成书”系列)【英】克莱尔·卢埃林(文),迈克·戈登(图),于水(译)电子工业出版社
《镜子里的小孩》 【中】向阳(文),几米(图)海豚出版社
《老鼠娶新娘》 【中】张玲玲(文),刘宗慧(图)二十一世纪出版社
《团圆》
【中】余丽琼(文),朱成梁(图)明天出版社
《我不要去幼儿园》
【法】丝特法妮·布莱克(著),武娟(译)二十一世纪出版社
《我不知道我是谁》
【德】乔恩·布莱克(文),阿克塞尔·舍夫勒(图),邢培健(译)南海出版公司
《我的第一本古诗小童话》 【中】金波等(文)中国少年儿童出版社
《我的第一套职业体验书——我最熟悉的„„》
【德】拉尔夫·布茨科(编绘),郭静(译)北京科学技术出版社
《小丑鱼》(“冰波童话绘本”系列)【中】冰波(文),谷米(图)教育科学出版社
《小马过河》(“中国优秀童话书典藏”系列)【中】彭文席(著),陈永镇(图)贵州人民出版社
《小威向前冲》
【英】尼古拉斯·艾伦(著),李小强(译)贵州人民出版社
《小小牛顿幼儿馆》(第一辑)
【中国台湾】台湾牛顿出版公司(编著)贵州教育出版社
《小猪尼奴》(“中国原创图画书”系列)【中】鲁兵(文),费嘉(图)中国少年儿童出版社
阅读年龄(7-9岁)
——基础部分(10本)
《安徒生童话选》 【丹麦】安徒生(著),禹田(改编)同心出版社
《猜猜我有多爱你》
【爱尔兰】麦克布雷尼(著),婕朗(绘),梅子涵(译)明天出版社
《稻草人》
【中】叶圣陶(著)河北少儿出版社
《丁丁历险记》
【比利时】埃尔热(编绘),王炳东(译)中国少年儿童出版社
《汉声数学绘本》(第一辑)【美】明德尔·西托默等(著),理查德·库法里等(绘),汉声杂志(译)贵州人民出版社
《千字文·三字经·弟子规》 【南宋】王应麟(著),郝光明(译注),【南北朝】周兴嗣(著),罗容海(译注),【清】李毓秀(著),王军丽(译注)文化艺术出版社
《让孩子着迷的77×2个经典科学游戏》 【日】后藤道夫(著),施雯黛、王蕴洁(译)南海出版社
《三毛流浪记》 【中】张乐平(著)译林出版社
《小飞侠彼得·潘》
【英】詹姆斯•巴里(著),傅东起(译)中国少年儿童出版社
《最美最美的中国童话》
【中国台湾】汉声杂志社(编)江苏美术出版社
——选读部分(15本)
《“我的自然科学课”系列》 【日】三枝博幸等(著),李奕、祁焱(译)天津人民美术出版社
《爱丽丝漫游奇境记》
【英】路易斯•卡罗尔(著),格里格•希尔德布兰特(绘),关建(译)江苏少年儿童出版社
《百岁童谣》
【中】山蔓(编著)贵州人民出版社
《穿裙子的小男子汉》
【英】大卫·威廉姆斯(著),昆汀·布莱克(图)接力出版社
《窗边的小豆豆》 【日】黑柳彻子(著),岩崎千弘(绘),赵玉皎(译)南海出版社
《大问题》
【德】沃尔夫·埃布鲁赫(著/绘),袁筱一(译)
北京联合出版公司
《第一次发现》
【法】法国伽利玛少儿出版社(编)接力出版社
《丁丁历险记》
【英】迈克法尔(著),邹晓平(译)中国少年儿童出版社
《格林童话选》 【德】格林(著),魏以新(译)西安交通大学出版社
《河川》
【日】加古里子(著),季颖(译)新星出版社
《杰德爷爷的理发店》
【美】玛格丽·金·米契尔、詹姆斯·瑞森(著/绘),柯倩华(译)连环画出版社
《你能听见我的声音吗?》 【日】田岛征三(文/图),夏河、林静(译)译林出版社
《图说中国节》 【中】大乔(编)中国社会科学出版社
《眼》 【波兰】伊娃娜·奇米勒斯卡(著),明书(译)
接力出版社
《这不是我的帽子》
【美】乔恩·克拉森(著),杨玲玲、彭懿(译)
明天出版社
阅读年龄(10-12岁)
——基础部分(10本)
《冰心儿童文学全集》 【中】冰心(著)中国少年儿童出版社
《草房子》
【中】曹文轩(著)
天天出版社有限责任公司
《城南旧事》
【中】林海音(著)陕西师范大学出版社
《科学家故事100个》 【中】叶永烈(著)21世纪出版社
《孔子的故事》 【中】李长之(著)21世纪出版社
《昆虫记》
【法】法布尔(著),富强(译)吉林出版集团有限责任公司
《林汉达历史故事集》 【中】林汉达(著)中国少年儿童出版社
《千家诗》
【南宋】谢枋得、【清】王相(编选),李乃龙(译注)
文化艺术出版社
《希腊神话故事》 【德】古斯塔夫·施瓦布(著),高中甫(译)中国画报出版社
《夏洛的网》
【美】E.B.怀特(著),任溶溶(译)上海译文出版社
——选读部分(15本)
《爱哭鬼小隼》
【日】河合隼雄(著),蔡鸣雁(译)浙江人民出版社
《哈里波特全集》 【英】J.K.罗琳(著),马爱农、马爱新(译)人民文学出版社
《假如给我三天光明》 【美】海伦凯勒(著),孙笑语(译)中国画报出版社
《老子说庄子说》
【中国台湾】蔡志忠(编/绘)生活.读书.新知三联书店
《鲁宾孙漂流记》 【美】笛福(著),马宇翔,潘小丽(译)外语教学与研究出版社
《诺贝尔奖获得者与儿童对话》 【德】福沃特·冯(编著),张荣昌(译)三联书店
《莎士比亚戏剧故事集》
【英】查尔斯·兰姆、玛丽·兰姆(改写),萧乾(译)人民文学出版社
《苏北少年“堂吉诃德”》 【中】毕飞宇(文),猪蹄(图)明天出版社
《童年河》
【中】赵丽宏(著)福建少年儿童出版社
《万物简史》(少儿版)【英】布莱森(著),严维明(译)接力出版社
《我的山居动物同伴们》 【中国台湾】朱天衣(著)海峡书局
《我们的母亲叫中国》 【中】苏叔阳(著)湖北少年儿童出版社
《小王子》
【法】圣埃克苏佩里(著),李继宏(译)天津人民出版社
《星空》
【日】关口修(著/绘),金海英(译)北京科技出版社
《寻猫奇遇记》
【英】麦克·莫波格(著),黄静雅(译)中国城市出版社
蜜蜂图书推荐 篇3
作者:[英]约翰 · 罗斯金/著 刘平/译
出版社:金城出版社
出版时间:2011年12月
定价:48.00元
本书展现了对约翰·罗斯金走上艺评之路的全景式描绘。它就像一幅展开的画卷,其中有罗斯金的父母对他的自始至终的关怀、影响,也有生活在其周围的人包括邻居、亲戚或朋友、老师、前辈等对罗斯金直接或间接的影响。始终贯穿全书的,是罗斯金的游历生活,它们无疑占据了罗斯金生命的重要部分,让他的生命藉此得以更加辉煌、灿烂。
书名:书之书
作者:蔡家园
出版社:金城出版社
出版时间:2011年12月
定价:48.00元
这是一本为书立言的书,它几乎包含了与书有关的一切。全书分为四辑:第一辑书香袭人,主要介绍了书之美、书之味、书腰、书签、藏书印、藏书票、书之态、毛边书、书虫;第二辑书之栖居,主要介绍了书架、书房、书店、图书馆;第三辑与书结缘,主要介绍了书痴、书商、读书、借书、藏书、窃书、禁书;第四辑书畔风景,主要介绍了书与影视、书与女人、书与咖啡、书与疗伤、书与广告。
书名:独立书店,你好!(第二季)
作者:薛原 西海固
出版社:金城出版社
出版时间:2012年3月
定价:45.00元
本书全面描述中国各地人文书店(含人文书吧),即文人笔下的中国人文书店风景。由各地的作家学者以他们的亲身体会和多年观察来描绘和展现各地人文书店的生存状态。书店被称为反映一座城市人文风景的窗口,也是体现一座城市文化内涵的缩影,有什么样的城市,就有什么样的书店,从书店的生存状态也可以反映当代中国的文化形态。主要介绍了台湾、广州、天津、长春、昆明、哈尔滨、沈阳、银川等《独立书店,你好!》(第一季)中没有收入的城市的独立书店,以及北京、长沙、西安等城市中的其他优秀的独立书店。
书名:书之孽
作者:[英]劳伦斯/著 黑马/译
出版社:金城出版社
出版时间:2012年1月
定价:38.00元
本书是英国著名作家D.H.劳伦斯的读书随笔集,收入劳伦斯论美国作家作品的杰作《美国经典文学研究》,以及劳伦斯论其他作家作品和自己的书的经典之作。这些随笔力透纸背,个性化十足,其中的《美国经典文学研究》更被誉为“现代文学批评中少有的杰作之一”,“不仅具有历史意义,亦是对文学批评的永久贡献,本身就是一部血运旺盛的文学作品”。
书名:大变局中的转折点
作者:蔡晓滨
出版社:金城出版社
出版时间:2012年3月
定价:29.80元
本书作者以一个三十多年报人的职业敏感与素养,选取了20世纪40年代那些曾轰动一时或引发广泛争鸣的新闻事件:中原饥馑、访问延安、公债舞弊、东北劫掠、重庆谈判、沈崇事件,等等,从源头到其背后以及其造成的影响、对历史进程的意义,对这些事件做了深刻的剖析,真实地反映了那个年代的史实。
书名:电影遇见书
作者:启航 宏玖
出版社:金城出版社
出版时间:2012年3月
定价:39.80元
高校图书馆个性化图书推荐系统研究 篇4
1 图书馆个性推荐概念及原理
1.1 图书馆个性推荐的概念
图书馆个性推荐是指以读者的个人背景、专业、习惯、爱好和提出的特别要求等为依据, 对每一位读者提供个性化推荐服务[1]。
1.2 个性化推荐原理
个性化推荐是信息的重组过程, 是信息资源的再分配, 是一种基于用户需求的个性化信息服务模式。其原理是以充分挖掘用户的个性化需求信息为前提, 主动组织信息资源, 并向用户推送其感兴趣的信息资源和信息服务。一方面是社会进步与图书馆自身发展的需要, 有利于提高图书馆的科技能力与服务水平。另一方面节省用户获取有效文献信息时间, 激发读者阅读兴趣, 提高图书的使用效率, 提高用户的满意度[2]。
2 图书推荐系统概况
2.1 推荐系统背景
推荐系统最初广泛应用于电子商务、电影推荐、音乐推荐等领域。它不仅为不同用户提供了方便商品、信息资源, 还为网站获得了不菲的赢利空间。亚马逊是最早使用推荐系统的网站, 其每年20%-30%的销售来源于推荐系统。如今将个性化推荐系统应用于图书馆, 深度挖掘个性化推荐的精准度及用户满意度已是图书馆界研究的热点, 无疑将对图书馆自身发展与建设起着较大的推动作用。
2.2 传统推荐系统种类
2.2.1 基于内容的推荐方法。
根据用户购买过的商品, 计算将要购买的商品与已购商品的相似度, 按相似度的大小排序向用户进行推荐[3]。该方法优点是操作简便, 推荐质量相对较高。缺点是算法复杂, 处理复杂结构难度大。
2.2.2 基于用户的协同过滤方法。
根据用户的基本信息和行为数据, 寻找与该用户相似的其他用户, 把其他用户的感兴趣的商品或信息推荐给该用户。该推荐方法不需对图书内涵进行深入分析, 只需对读者的特征及借阅记录进行分析, 就能获得读者感兴趣的个性化图书推荐。该方法优点是能作音频、视频处理, 算法简便, 针对用户评价提供个性化推荐程度高。缺点是易产生冷启动、数据稀疏问题。
2.2.3 基于关联规则的推荐方法。
该方法是如何建立关联规则, 根据用户关联规则的相似性, 向用户推荐所需个性化信息。该推荐方法能够分析隐藏的关联规则, 不足是由于图书管理系统中数据量大、类型复杂、学科跨度大等原因, 造成图书特征展示不全面, 推荐质量较低, 推荐效果不佳[4]。
2.2.4 混合推荐方法。该方法使用多种推荐方法, 各种方法博采众长, 查漏补缺。
总之, 本文通过中国知网搜索“个性化图书推荐系统”, 共获得56 318条结果, 1979-1999年发表文章不足100篇, 2000-2003年达到近1 000篇, 2004-2014年增速较快, 且2014年达到最高值6 172篇, 表明我国图书推荐系统研究进入快速发展、重点关注及热门研究阶段, 2015年达3 320篇, 稍有回落, 说明我国此方面研究进入良性发展、逐步完善与理性研究阶段。从发表文章及研究成果进行分析来看, 我国图书推荐系统理论研究居多, 用于实践居少;开发人员虽然也进行了针对性的开发技术研究, 但不能完全满足读者的个性化需求。这就要求我们在以后的工作中, 要充分借鉴已取得数据挖掘技术的相关成果, 根据学校定位、馆藏特色及读者需求, 研究、设计出符合本馆特色的个性化图书推荐系统。
3 传统推荐系统存在问题
3.1 数据分布不均
图书馆的信息资源大多由自建信息资源、外购数据资源和共享数据资源构成。在数字资源引进上, 高校图书馆或采购部门根据学校特色、学科需求、资源需求、现有资源等因素合理建立所需馆藏资源, 每所高校都有不同办学特色, 因此, 不同高校馆藏资源分布无论种类、数量都存在分布不均衡的现象。而公共图书馆偏重于读者喜好、需求与使用量来采购图书资源, 这就造成某些类图书资源过多, 而另一些类图书资源相对匮乏的现象。
3.2 数据整体稀疏
随着传统图书馆向数字图书馆、智慧图书馆转变, 图书馆的信息资源越来越丰富, 读者使用数字资源的人数也呈逐年上升趋势。如果图书馆的信息资源与读者之间产生关系与所有关系占比来看, 由于图书馆的信息资源有一定重复率, 而读者是唯一的没有重复性, 且大部分读者所选信息资源重复率较低, 所以, 相对而言, 图书馆的信息资源数据存在整体稀疏性。另外, 随着办学规模与招生人数的增加, 大部分高校图书馆图书的数量是在校生人数的100倍, 且图书每年以6%左右的数量递增, 而图书馆75%的图书未被借阅, 这也造成图书馆历史借阅数据的极大稀疏性。数据的稀疏性直接影响个性化信息推荐, 且推荐效果不佳。
3.3 传统个性化服务方式不足
在传统的个性化信息服务中, 通常采用问卷调查、网络访谈、电话咨询等方式针对读者不同信息需求, 由学科馆员进行搜集、整理、加工、分析, 提供针对性的个性化图书推荐服务。随着大数据时代的到来, 图书馆信息繁冗而复杂, 传统的个性化服务方式越来越不能满足读者的信息需求。
3.4 用户流失现象
面对互联网的快速发展与信息技术高速增长, 由于图书馆个性化信息服务不强及使用不便等原因, 当今大学生读者对图书馆的依赖性越来越低。表现为到馆率低, 纸质图书与期刊借阅率呈逐年下降的趋势, 他们更多的是借助百度、谷歌、SNS等获得信息支持[5]。
3.5 社交网站的信息反馈参考
随着互联网信息快速发展及web2.0、web3.0在社交网站的广泛应用, 广大的读者在豆瓣网 (中文网站中除新浪微博、人人网而排名第三) 、读书网站、电影电视剧网站、电子购物网站等留下了大量的评论信息, 这些网站拥有大量的来自不同职业类型层次的读者, 其庞大的信息评论可以作为深入挖掘数据的重要参考依据[6]。
4 个性化图书推荐创新策略
4.1 扩大宣传渠道, 加大采购力度
图书馆信息资源分布不均, 极易产生冷启动问题。为此, 一方面, 图书馆要加大宣传渠道, 对读者因不了解馆藏信息资源而借阅率不高的图书加大宣传力度, 主动向读者宣传推介, 激发读者阅读兴趣, 提高资源的使用率。另一方面, 加大类别欠缺图书的采购力度, 丰富馆藏资源, 加大贫乏资源的引进力度。另外, 利用多维数据交叉推荐的方法, 也能在一定程度上解决冷启动问题。
4.2 减少图书复本, 增加购书品种
国家对本科高校水平评估指标中, 每年采购一定数量的新书, 对采购图书的复本数没有严格的限制, 导致只注重数量而不注重品种及质量, 加之各高校经费有限, 用于图书馆购买新书的经费更是有限, 所以, 不能保质保量地完成每年新增图书的采购, 导致库存资源因复本多而整体稀疏。所以, 采购图书, 应侧重增加图书种类, 严格限定复本数, 以此缓解整个库存资源的图书稀疏问题。另外, 可以把读者或资源进行粗粒化, 使数据变得稠密, 从而有效缓解数据整体稀疏问题。
4.3 针对不同用户, 实施信息推送
一是智能手机终端、IPAD等移动设备的普及, 高校图书馆师生普遍通过移动终端获取信息服务已成共识。为此, 高校图书馆适时推出微信、微博、掌上电脑、移动图书馆等服务, 通过信息浏览记录获取读者地理位置、阅读兴趣的行为信息, 从而进行深入挖掘与分析, 为用户提供精准个性化信息服务;二是针对读者借阅馆内信息资源, 为读者提供相似读者的图书推荐信息, 向读者推荐尚未发现的馆藏资源;三是针对读者使用移动终端位置及类型, 向读者及时提供新进图书、书展、讲座等信息服务。
4.4 借鉴信息评论, 提供挖掘参考
针对高校校内读者信息、图书信息、借阅行为信息相对充足, 校外高校馆、公共馆、社交网站读者信息欠缺现象, 高校图书馆应加强馆际交流, 加强与资源供应商的交流与互动, 充分借鉴他们的网站读者评论信息及推荐结果, 有效节省图书挖掘推荐时间, 提高图书推荐使用效率, 加大阅读推广范围与力度, 扩大文化宣传作用与效果, 从而达到弘扬中华文化、传承人类文明及促进全民阅读的文化氛围。
5 思考与展望
5.1 用户隐私问题
随着数据挖掘技术在图书馆的广泛应用, 系统对用户的阅读信息进行筛查、甄别、分析、整理, 用户的上网信息数据被系统隐性跟踪与实时监控, 用户的隐私受到一定程度的侵犯及威胁。因此, 一定要征求用户的同意, 及时删除与数据挖掘不相关的读者信息, 尽量避免因读者的信息隐私外泄而产生不良纠纷。
5.2 用户信息获取的局限性
高校图书馆的读者信息大多来源于校园内, 而校园以外的读者信息大多被数据供应商和电信运营商所拥有, 而对数据的深度挖掘与深入分析, 只有对读者行为数据达到一定存储规模和数据耦合度时, 才能获得精准化个性图书推荐。可见, 数据来源的局限性, 在一定程度上降低了个性化图书推荐的精准性[7]。社交网站拥有大量用户的社交信息、文本信息以及个人基本信息, 这些数据信息的获取有利于对读者进行个性化图书的精准推荐。
5.3 信息安全问题
随着大数据时代的到来, 云计算、物联网等技术高度开放, 新读者和新资源快速增长, 云数据中心一旦遭到病毒攻击、黑客入侵, 其数据中心不仅包括丰富的数据资源、读者信息、行为信息、阅读兴趣等, 可能引起因数据资源使用不确定性而导致版权问题, 以及因读者信息外泄引起的不必要争端问题[8]。
6 结语
随着图书数据资源日益丰富, 读者在浩瀚的书海中快速寻找到自己所需图书确属难事。因此, 图书馆要充分发挥自己的人力、物力和技术资源优势, 深入挖掘读者信息、行为信息和图书馆自身资源信息, 加大进行深入精准挖掘数据信息和用户满意度的研究, 提高图书使用效率, 激发读者阅读兴趣, 提升图书馆的整体科研能力与服务水平, 扩大高校图书馆的社会地位及影响力。
参考文献
[1]联想虚拟云终端系统[EB/OL].http://wenku.baidu.com/view/44f5826fafab069dc02e8.html.2011-04-09.
[2]王连喜.图书馆个性化图书推荐面临的问题及挑战[J].现代情报, 2013 (6) :3-5.
[3]周奇, 陆敬筠, 朱晓峰.基于社交团体和用户相似度的信息推荐方法[J].情报理论与实践, 2016 (1) :123-127.
[4]孙彦超, 韩凤霞.基于协同过滤算法的个性化图书推荐系统的研究[J].图书馆理论与实践, 2015 (4) :99-102.
[5]艾春艳, 游越, 刘素清.读者参与的高校图书馆学科服务新模式探索[J].大学图书馆学报, 2011 (5) :70.
[6]陈宇亮, 沈奎林.基于读者评论的图书推荐系统研究[J].图书情报导刊, 2016 (9) :6-9.
[7]栾旭伦.大数据环境下高校图书馆个性化信息服务系统研究[J].图书馆学刊, 2014 (8) :118-121.
活动图书推荐目录 篇5
小学1——2年级
1.曹文轩说故事•一只叫凤的鸽子(曹文轩 著 乌猫 绘)2.迷路的脚丫(张晓楠 著 马小得 绘)3.东逛西逛(梅子涵 著)4.眼睛树(金波 著)5.小男生杜歌飞(杨红樱 著)6.小女生金贝贝(杨红樱 著)7.一年级的小豌豆(商晓娜 著)8.一年级的小蜜瓜(商晓娜 著)9.诵﹒读(肖德好 著)10.弟子规([清]李毓秀 著)
11.安徒生童话([丹麦]安徒生 著 青木 编译)12.格林童话([德]格林兄弟 著 邵珠磊 编译)
13.列那狐的故事([法]玛特•艾•季诺夫人 著 邵珠磊 编译 14.伊索寓言([古希腊]伊索 著 邓志娟 编译)15.木偶奇遇记([意]卡洛•科洛迪 著 邵珠磊 编译)16.小鹿斑比([奥]萨尔腾 著 唐华 编译)
17.小老鼠皮克历险记([苏联]维•比安基 著 邵珠磊 编译)18.成语故事(闻钟 著)
19.森林报([苏联]维•比安基 著 邵珠磊 编译)20.你看起来好像很好吃(宫西达也 文图 杨文 译)21.彩虹色的花(再版)(麦克〃格雷涅茨 原作/图)
38.妖怪山(彭懿 文
九儿 图)39.从外星球来的孩子 40.小橘灯
期 刊
1、中国少年报(是由共青团中央主管,中国少年儿童新闻出版总社出版的有55年辉煌历史的综合类报纸。)
2、中国儿童报(是全国少年先锋队队报,是专为少先队员打造的旗帜类刊物)
3、小哥白尼(中国少年科学院院刊)
4、智力大王(全国最早创办提高孩子学习、动脑、动手兴趣的 刊物)
5、幽默小读者(是提高孩子们读书兴趣和幽默能力的专业类刊物)
6、米老鼠(全球52个国家同时发行的最时尚漫画杂志)
天翼图书推荐 篇6
李咏徐竞著
中国经济出版社2008年12月版
定价:38.00元
在全球输血华尔街黑洞之际,有识之士发出“凭啥华尔街犯错,最终要我们买单”的声音。书中首次提出“20年周期坍塌”假说,理性前瞻中国农村的第二次变革,全景扫描金融风暴之后中国面临的机遇与选择。书中指出:什么才是政府手中的“粮”?当然是内部需求。我们长期盲从“出口创汇”的后果是什么?难道是辛苦换回来的成捆成筐的美钞被美联储贬为一地白纸?
匿名的香蕉为什么不热销
[美]罗希特·巴尔加瓦著
中国人民大学出版社2008年12月版
定价:36.00元
最终决定产品的市场地位的是品牌本身的个性,而不是产品间微不足道的差异。到底是什么让我们毫不犹豫地迈进星巴克点一杯拿铁、手指习惯绕着iPod的触摸键不断转圈、在超市里惯性采购都乐香蕉——有名字的香蕉?个性才是这一切的“始作俑者”。个性不是功能多,也不是差别大。个性是一种姿态,你只需要说:“嗨,这就是我!”个性就被自然而然地勾勒出来了。
游戏颠覆者
[美]A.G.雷富礼、拉姆·查兰著
机械工业出版社2008年11月版
定价:39.00元
2000年,当雷富礼临危受命接管深陷困境的宝洁公司时,没人相信他能在短短几年内就成功实现绝地反击。2001年到2007年,宝洁的销售额几乎翻番,利润增长两倍,拥有23种销售额超过10亿美元的品牌。2008年,荣膺美国最佳CEO的雷富礼与管理大师拉姆·查兰首度揭示了宝洁大逆转的幕后驱动力。
碰撞:世界金融新版图
[美]穆罕默德·埃尔埃利安著
机械工业出版社2008年11月版
定价:38.00元
图书推荐系统 篇7
如今,高校图书馆的图书储量非常丰富,但是,读者想要准确快速找到符合自己个性化需要的图书资源却比较困难。一方面,信息资源过于庞大,检索信息需要花费很大的时间和精力,另一方面,用户的个性化需求也不尽相同,难以满足所有用户的实际需求。如何利用现代信息技术满足读者在学习生活中的个性化需求是当前高校图书馆一个亟待解决的问题。通过对海量的信息进行数据挖掘,同时基于挖掘出的知识开展个性化的图书推荐是当前高校转变服务方式,提高服务质量的有效手段之一。
目前,主流的非结构化文本数据推荐服务分为基于内容的推荐,基于关联规则的推荐和基于协同过滤的推荐等三类。其中,基于内容的推荐,是在没有足够的数据下,可以向具有不同兴趣偏好的用户推荐非流行的项目。LIBRA是很早的基于内容的图书推荐系统,由每位用户提供的训练例子,使用贝叶斯学习算法,从Web提取图书的标题等信息,推荐图书[1]。其特点是,算法简单,查准率和查全率较高。但是内容提取的能力有限,面对高校的数量庞大,内容复杂的信息资源难以准确全面进行内容挖掘。而基于关联规则的推荐是根据用户浏览或者购买的日志生成规则,通过生成的规则来推算用户可能还会对哪些商品感兴趣[2],最早的基于关联规则的推荐系统有IBM的Websphere,ILOG和BroadVision等等。在图书推荐领域,引用关联规则是为了发现借阅记录中不同图书之间的关联规则,当多本书存在一定的置信度,支持度,则存在一定的关联[3]。其特点是,算法复杂,查准率较高,但同时它无法发现读者的新的或者隐含的阅读兴趣,容易生成无效的规则。基于协同过滤的推荐思想是认为用户的兴趣偏好是可以通过具有类似行为或偏好的用户群进行分析和预测得出的,利用最近邻预测技术,预测当前用户可能感兴趣的项目[4]。它适用于在有足够的用户数据的时候,可以向具有相同兴趣偏好的用户推送受欢迎的推荐,但是数据往往是稀疏的[5]。
在高校的特定的信息环境中,馆藏资源数量庞大,类型各异且学科覆盖广泛,大量的跨学科,跨专业乃至新型学科和边缘学科图书的存在,造成基于内容的图书推荐系统所构建的模型很难全面准确表征图书资源的内容,因此推荐质量比较低,难以满足高校师生对推荐资源的个性化的需求。高校图书馆读者较高的借阅频次,相似的知识结构以及共同的知识背景,使得高校图书馆存在着大量相似度较高的借阅记录,基于规则的推荐难以提供产生合适的关联性规则,最终难以推荐符合读者个性化需求的图书资源。
基于以上的研究,为了达到更好的推荐效果,可以将读者进行分类,构建出读者的学习风格模型,根据读者表现出的具体的学习风格,推荐符合其学习特征的图书,并依据该模型采用改进的协同过滤算法开展个性化的图书推荐,以较低的计算复杂度,挖掘包含读者潜在兴趣在内的个性化信息需求,达到为高校读者提供高质量的个性化的图书推荐服务的目的。
2 基于协同过滤的个性化图书推荐模型
传统的基于项目评分的协同过滤算法仅依据用户的信息获取行为及评分情况进行预测,缺乏对触发用户信息需求动因的深层次的分析,因此无法从本质上保证预测结果的准确性,而且容易造成数据稀疏。本文提出一种改进的基于协同过滤的个性化图书推荐模型如图1所示:
在该模型中,当读者登录系统时,首先引导用户进行数据量表的数据测试,显式地将用户进行分类,并构建出读者的模型库。当新的读者登录系统并已经拥有了自己的学习特征风格时,就在读者模型库中找到其候选的最近邻集,再根据最近邻集构建User-Item矩阵,并产生目标读者的最近邻,最后根据目标读者最近邻的阅读行为挖掘出与读者个性化需求相匹配的图书,实现对目标读者的个性化推荐。
2.1 读者特征模型的构建以及候选最近邻的生成
Felder-Silverman量表(也称所罗门学习风格量表)是由Felder和Solo-man于1997年开发。它从信息加工,感知,输入和理解四个方面将学习风格划分为4组,分为8个维度,包括:活跃型与沉思型,感悟型和直觉型,视觉型和言语型,序列型和综合型。用于系统前测推断用户学习风格,已经得到越来越多的研究者的认可,其具有良好的实用性和信效度,能够比较全面反应学习者的学习风格。
学习者的学习风格是依据Felder-Silverman学习风格问卷(Index of Learning Styles Questionnaire,ILS)推断出的,该问卷由44道题目(每道题有a,b两个选项)组成,学习风格每种维度都对应11道题(如表1所示)。当用户登录系统时,首先进行问卷量表的数据测试,即进行自我评价的调查。通过问卷的手段,利用文本挖掘技术,建立用户的学习风格模型。活跃型/沉思型问题1591317212529333741总计计算方法:(较大数-较小数)+较大数的字母a11111111197a b112感悟型/直觉型问题26101418222630343842a1111111185a b1113视觉型/言语型问题37111519232731353943a1111111173a b11114序列型/综合型问题48121620242832364044a11114b111111173a
上表中,当用户登录系统时,通过问卷调查,针对系统给出的44道问题开始自我评价,针对每道问题,若符合自己实际情况,则标记对应的a或b为数字1,最终计算每个维度的总计值,方法为:(较大数-较小数)+较大数的字母。若存在某个用户User1,在第一维度的评分如表1所示,它的第一维度的最终得分为7a,再根据风格评价指标图2所示,则User1第一维度上的类型为活跃型,类似地在其他维度上,可以测出其他类型,最终形成了该用户在四个维度上的学习特征模型。
由此可见,Felder-Silverman学习风格问卷是一种多方位,多维度的分类标准,以这种标准,用户的特征可以得到最大限度的确定,方便了系统根据其学习风格模型进行图书的推荐,同时由于基于用户的协同过滤算法需要和样本数据中的每一个学习者进行兴趣相似度的计算,所以存在计算量大的弊端。通过这种显式的分类,计算用户间的相似度便集中在了同种学习风格的用户之间,在一定程度上降低了算法的时间复杂度。因此,通过每位读者登录系统前的自测,便给不同的读者赋予了不同的学习风格特征,每一种特定的学习风格特征集合即为一种候选最近邻集合UserList,对已登录读者的分类结果如读者分类结果表2所示:
2.2 读者最近邻生成
对于每个候选最近邻集合中的读者Ui,Ui∈UserList(i),先得到Ui和目标读者在一定的期限内借阅图书的浏览矩阵BrowseMatrix,利用修正的余弦相似度计算公式计算与读者最相似的Top-N个读者作为目标读者的最近邻。公式如下:
其中,sim(u1,u2)表示读者u1和u2的相似度,book表示读者u1,u2共同产生评分的图书。
2.3 产生推荐的书目
采用的混合推荐算法包括随机推荐算法和基于用户的协同过滤算法。其中,随机推荐算法主要可以解决冷启动和稀疏矩阵问题,挖掘用户的潜在兴趣,提高系统的泛化能力。基于用户的协同过滤推荐则是根据用户之间的相似度,最大限度地挖掘目标用户感兴趣的图书。系统设定一个启用基于用户协同过滤算法的阈值TR,当达到此阈值时启用基于用户的协同过滤算法。
基于目标用户浏览矩阵的不同状态,在初始阶段有三种不同的典型特征:1)图书浏览矩阵为空。2)登录用户的浏览矩阵为空3)登录用户所浏览的图书的数目不足以达到启用Users—CF算法进行推荐。此时系统满足这三种状态特征即采用随机推荐。
在过渡阶段主要两个主要的特征:1)图书浏览矩阵不为空。2)登录用户所浏览的图书的数目不为空,但是达不到要启用User—CF算法的阈值。过渡阶段的推荐仍然需要采用随机推荐算法进行。
在平稳阶段,用户的浏览的图书的数目足以达到启用Users-CF算法,此时便可以主要使用Users-CF算法进行推荐,同时,可以在推荐的总数中设定一定数目的以随机推荐算法推荐得到的图书,从而提高推荐的多样性,提高系统的泛化能力。
基于用户的协同过滤的推荐方法的主要思路是,在某读者user(i)最近邻集合User-List(i)中,遍历每一本存储在数据库中且用户已经评分过的图书booki,如果目标用户没有浏览过该图书booki,并且读者最近邻集合中任意一用户Ui喜欢该图书,则将该图书推荐给目标用户。算法1显示了基于用户协同过滤算法的改进后的一种混合推荐算法,输入参数包括用户的Id,推荐的书目Tn,启用协同过滤算法的阈值TR;输出参数为通过混和算法最终推荐后的图书矩阵Tr。
3 图书资源特征库的构建
如果新用户第一次登录系统,进行问卷量表的数据测试,根据其显式的学习风格特征,并结合候选最近用户的已有的浏览图书记录,为新用户随机推荐n本图书,保证该新的用户有过浏览图书浏览的记录,在新用户浏览图书时,新用户可以对随机推荐的图书进行显式或者隐式的打分。所谓显示的打分,意味着新的学习者,在浏览该图书后主动地给该图书进行评分,我们在实验中假定评分的最高分值为5分,如果其打分的分值不小于3分,则代表喜欢该图书,则在其兴趣喜好矩阵中对该图书标记为1,否则标记为0;所谓隐式的打分,即根据新的学习者在该图书浏览上停留的时间,进行打分,我们设定一个时间的阈值,如果学习者阅读的时间达到该阈值,则代表其对这本书感兴趣,同样,在图书资源特征库中,对该图书的浏览喜好矩阵中,标记为1,否则,标记为0。
4 实验结果及分析
实验数据来自西南石油大学数字图书馆,针对计算机科学学院,理学院,化工院,法学院四个学院,借阅时间在2015年9月1日至2016年3月1日的共计101721条借阅记录进行清理和处理,借阅记录中读者信息包括(读者ID、借阅时间、实际归还时间等),同时,图书信息包括(书名、作者,出版社、出版年、单价和索引号等)。在实验中基于用户的协同过滤算法是基于已有的数据集进行的,在本实验中,我们将实验数据分为两部分来处理,用经过我们清洗和整理的前5000条数据作为实验数据,后5000条数据作为测试数据,用于验证该模型的拟合效果和推荐效果。事实上,在初始阶段,所有的新的用户的浏览矩阵为空,但是随着推荐的数目越来越多,新的浏览过的图书又会被记录到已有的用户浏览矩阵当中,最终,我们则可以基于用户的浏览矩阵和兴趣矩阵计算该推荐模型的召回率和多样性。
在实验中,根据算法中所需要的不同参数,调整参数值的大小,根据其之间的相互影响,通过反复实验,达到最佳的推荐效果。经过在相同条件下的反复多次实验,在实验1中,我们依次将启用基于用户的协同过滤算法的阈值设置为1,2,3,4,分别实验了在推荐书目为10,20,30本情况下的召回率。图-3不同阈值下的召回率实验结果图显示了在推荐书目数量为20本,最相似的邻居个数为40个时,召回率Recall达到峰值0.675。
在实验2中,设定了用户的兴趣相似度最近邻为40人,随着推荐书目的增多,算法多样性值呈递增趋势,当推荐时的书目为40本时,推荐效果的多样性Diversity达到峰值0.85.最后实验结果如图-4不同推荐书目下的多样性实验结果图所示。图4不同推荐书目下的多样性
实验的推荐查准率如图5,推荐差准率结果图显示,在推荐20本图书,并且选择40个最近邻时,达到系统的最佳推荐查准率73%,已经达到良好的推送质量。
5 结束语
本文提出了一种对读者学习风格模型的构建的策略,并结合改进后的基于用户协同过滤的混合推荐算法,有效地提高了推荐的质量,达到了为读者提供个性化图书资源的目的。通过反复多次的仿真实验,有效地解决了原有的基于用户协同过滤算法的稀疏矩阵和冷启动问题,达到了良好的推荐。
摘要:针对高校数字图书馆对读者需求信息挖掘不足,无法主动为读者提供个性化图书推荐服务的问题。该文引入所罗门学习风格量表,多维度、全方位的构建读者特征模型,并提出基于随机算法与协同过滤推荐算法的混合推荐算法。首先,读者通过数据量表测试得到其学习风格,然后根据读者的浏览矩阵,在同种学习风格的用户群体中进行用户之间的相似度计算,最后采用Top-N的策略向用户进行图书推荐,为读者提供符合其个性特征的图书。实验结果表明,应用该算法能有效提高系统的推荐质量,达到良好的推荐效果。
关键词:协同过滤,图书推荐系统,个性化推荐,混合算法,学习风格量表
参考文献
[1]Raymond J.Mooney,Loriene Roy.Content-Based Book Recommending Using Learning for Text Categorization.In Proceedings of the Fifth ACM Conference on Digital Libraries,2000:195-204.
[2]王静.基于关联规则的图书销售网站个性化推荐系统设计与实现[D].电子科技大学,2012.6.
[3]陈定权,朱维凤.关联规则与图书馆书目推荐.情报理论与实践,2009,32(6):81-84.
[4]安德智,刘光明,章恒.基于协同过滤的图书推荐模型图书情报工作,2011,54(1):35-38.
图书推荐系统 篇8
1CommonKADS方法
Common KADS方法是一种提供整个应用模型的知识工程方法,它强调知识的动态属性[2,3]。在进行知识建模过程中,首先要考 虑知识的 概念结构 把编程细 节放在之 后 。 Com-mon KADS提供一组模型套件来进行知识分析与开发,包括组织模型、任务模型、主体模型、知识模型、通信模型和设计模型[1]。
2图书馆个性化推荐服务
个性化服务要求根据不同用户的信息需求,提供不同的服务内容,推荐系统要求从图书馆提供的众多资源中找到不同用户所需要的文献信息。个性化推荐系统,是将推荐信息作为输出的系统,它包括输入功能模块、推荐方法模块和输出功能模块[4]。
关联规则推荐是基于数据挖掘的推荐方法,通过挖掘相应的关联关系结合用户需求进行推荐。特点是能发掘出用户新兴趣,但关联规则抽取比较困难和耗时。
3系统模型
个性化推荐系统的开发,使用层次化的知识建模方法,它可以提高应用系统的重用性和可扩展性。在系统建模过程中, 可以使用数据库、人工智能等软件工程的各种技术和方法,还可以通过和其他建模方面混合使用来提高系统的性能。个性化推荐系统建模按照Common KADS方法,首先分析组织模型、 任务模型、主体模型,然后建立推荐系统的知识模型。
(1)组织模型
组织模型主要用来分析系统组织架构的实现目标,系统中可能出现的问题,对是否实现知识系统进行可行性研究,它使用工作表来描述。
组织模型以OM-1工作表来描述组织语境、任务、外部因素、解决方案等内容。图书馆个性推荐系统的组织语境,如下表所示:
从表1中看出系统存在的两个问题;一、用户的需求不明确;二、系统提供的信息和读者需要不匹配。
OM-2工作表主要用来描述个性化服务系统的核心组织部分,侧重于组织中一些可变的内容。
OM-3工作表,描述部分组织中的知识资产。
(2)任务模型
Common KADS任务模型可以在组织任务和系统任务之间建立联系,明确任务功能。任务模型中的一些方面,是对组织进行考虑的。任务模型中的信息借助工作表TM-1说明,TM-1可以看作是OM-3工作表中数据的进一步精细。
(3)知识模型
知识模型包括系统中的各类知识和结构,不同的知识在系统中实现不同的应用。知识模型的创建分为三个部分,分别是领域知识、推理知识和任务知识。
结合任务模板构建个性化推荐系统推理结构图,如图1所示:
任务知识,用于描述系统要实现的目标,以及如何实现目标的解决策略。任务知识可以采用层次方式来描述,对应用系统的任务进行分解,把目标任务分解为一系列小任务。
顶层任务命名为recommend-case。把分组看成一个任务对它们进行详细描述。
领域知识,用于描述应用领域中的知识对象和静态信息。 在图书馆的个性化服务系统中,用户与资源是两个核心对象。 根据推荐系统推理结构图建立领域信息。推荐系统包括用户信息、需求信息、推荐方法、可提供的资源等内容。
4结束语
图书馆图书推荐算法的研究 篇9
数字图书馆逐渐向自动化、智能化、个性化发展。数据资源丰富,属性众多,信息冗杂,但是有效利用率并不高,而且读者接受的服务并不具有针对性。个性化图书推荐可以根据个人图书借阅历史、用户的浏览痕迹和用户的资料,找出学生或者老师可能感兴趣的图书,由此向学生或者老师推荐相关的图书,图书推荐的方式有很多方法,例如基于内容的推荐、基于关联规则的推荐和基于协同过滤的推荐等。
协同过滤是分析用户兴趣,并找出与当前用户有共同喜好的用户,然后根据相似用户对某一项目的喜好度,预测当前用户是否喜欢此项目,由此作出推荐。算法的推荐原理非常的简单。用户的信息与项目在预测部分要事先预处理下,然后输出推荐的结果。
2协同过滤算法的分类
根据Breese等学者的研究,可将协同过滤算法分为两大类:基于模型的协同过滤算法(Model.Based Collaborative Filtering)和基于记忆的协同过滤算法(Memory—Based Collaborative Filtering)。
基于模型算法的主要思想是根据机器学习或者统计方法对用户的评分信息进行建模,通过建好的模型来预测用户的喜好度,以此来作出推荐。常用的建模算法有潜在语义技术、聚类技术、Bayes算法以及支持向量机等算法。支持向量机算法具有实时性较好,稳定性较高,但是需要建立大量的模型,并且费用较高。
基于记忆的协同过滤算法主要分为基于用户的协同过滤算法(User-based Collaborative Filtering,UBCF)和基于项目的协同过滤算法(Item-based Collaborative Filtering,IBCF)两类。在本文中,将详细介绍基于项目的协同过滤算法。
3基于项目的协同过滤算法
基于用户的协同过滤推荐算法㈣有扩展性和稀疏性问题,在2001年,Sarwar等人提出了基于项目的协同过滤算法[351。其基本原理用户对项目进行喜好评分,根据这些评分计算项目之间的相似度,把相似的项目推荐给用户。原理如图1所示。
从图1中可以看出学生A对图书1和图书,3感兴趣,学生B对图书1、图书2和图书3感兴趣,学生C对图书1感兴趣,可以推出,图书1和图书3是比较相似的,对图书1感兴趣的学生可能也对图书3感兴趣。由此也可以推出学生C对图书3也比较感兴趣,可以考虑将图书3推荐给学生C。
基于项目的协同过滤算法主要有三个步骤,先计算项目之间的相似度,然后选择近邻,最后作出推荐。
(1)项目之间相似度的计算。常见的计算相似度的算法有Pearson相关系数法(Pearson Correlation Coefficient)、余弦相似度法(Cosine Similarity)和调整余弦相似度法(Adjustment Cosine Similarity)。例如:Pearson相关系数:计算两个项目之间的线性关系,如式(1)所示
在上式中,simuv表示项目u和v之间的相似度,rui是用户u对项目i的评分,rvi是用户v对项目i的评分,ur是用户u在已经评价过的项目上的平均分,vr是用户v在已经评价过的项目上的平均分。
(2)寻找相似邻。计算了项目之间的相似度后,寻找相似近邻。最常用的寻找相似近邻有K均值方法和设阈值法。
(3)产生推荐。主要有两种方法:Top-N推荐列表和预测当前用户对项目的评分。考虑到求平均值是不太理想的,有人提出了使用加权平均值方法。主要两种方法,具体如式(2.10)与式(2.11)所示。
其中,simnuv为项目间的相似度,项目间的相似度越大,则预测评分的影响就也越大。
4算法实验验证
本文实验评估仍然基于Book.Crossing数据集,学校图书馆中用户对图书的评分从2003年到2015年的评分有1e10条记录,是由1e6个用户对5e5的评分,这些评分是0~5,0表示用户不喜欢,5表示用户非常的喜欢该本图书。对算法进行测试,测量真实评分与预测评分之间的平均绝对误。算法运行5次,平均误差小于0.5%,因此,说明算法具有很好的推荐效果。
5结语
阐述了协同过滤推荐算法的相关理论,重点介绍基于项目的协同过滤算法,算法的步骤可以分为项目之间相似度的计算、寻找相似邻和产生推荐三个方面。实验结果表明,该算法具有一定的推荐效果。
参考文献
图书推荐 篇10
编著:中国科技发展战略研究小组
出版:科学出版社
定价:68.00元
本报告的主题是金融危机、技术创新与产业升级。报告围绕金融危机和经济周期的起源及创新的关系作了深入的分析。报告解剖了美国金融危机的深层原因, 并对我国政府及地方政府如何应对这场危机作了分析。然后, 报告结合中国制造业的发展现实, 就如何进行危机后的技术创新能力建设与产业升级提出了看法和政策建议。
木塑复合材料
编著:[俄]Anatole A.Klyosov;王伟宏, 宋永明, 高华译
出版:科学出版社
定价:99.00元
木塑复合材料这种新兴的环保材料产品在世界范围得到越来越多的关注和认同, 其生产量和使用量都在逐年快速增加。本书以通俗易懂的语言和简洁明了的方式, 系统地介绍了制造木塑复合材料所用原料 (木质纤维材料、塑料、填料和偶联剂) 的种类、性能及其在产品中的作用;在材料性能方面阐述了弯曲、压缩、拉伸、热膨胀收缩、线性收缩、防滑性、吸水性状等物理力学性能的主要影响因素和变化规律;对新近引起企业和学术领域关注的热点问题, 如燃烧性能、抗微生物降解性能、抗氧化性能以及流变性能等, 进行了详细地阐述;在相关部分给出了原料与制品性能检测方法的国外标准, 并简要介绍了具体方法。全书以大量的数据和丰富的例证作支撑材料, 实用性强, 理论分析深入, 见解独到。
本书可供从事木塑复合材料生产、应用、产品检验和科学研究等工作的工程技术人员、科研人员和管理者阅读参考, 也可供相关专业的大学生和研究生阅读。
2010高技术发展报告
编著:中国科学院
出版:科学出版社
定价:46.00元
全书在综述2009年高技术发展动态的同时, 以新材料、新能源技术为主题, 着重介绍新材料、新能源技术发展趋势、产业化动态、产业创新能力与国际竞争力、高技术与社会等社会普遍关注的重大问题, 提出促进中国高技术与产业发展的思路和政策建议。
多层低温共烧陶瓷技术
编著:[日]今中佳彦 (Yoshihiko Imanaka) ;詹欣祥, 周济译
出版:科学出版社
定价:45.00元
本书全面介绍了低温共烧陶瓷 (LTCC) 技术, 给出了大量20世纪80年代富士通和IBM美国公司开发的大型计算机用铜电路图层的大面积多层陶瓷基板的工程图表。全书共10章。第1章绪论, 概述了低温共烧陶瓷技术的历史、典型材料、主要制造过程等。第2章至第9章分为两大部分, 第一部分为材料技术, 包括第2章至第4章, 论述了陶瓷材料、导体材料及辅助材料的特性和应用;第二部分为工艺技术, 包括第5章至第9章, 细致地描述了各工序特点、工艺条件、控制、在制品评价、缺陷防止和产品可靠性等诸多问题。最后, 在第10章, 展望了低温共烧陶瓷技术的未来发展。
本书适合从事电子、材料等领域研究、开发和生产的技术人员参考阅读, 也可作为高等院校相关专业的研究生、本科生教材使用。
纳米流体能量传递理论与应用
编著:宣益民, 李强
出版:科学出版社
定价:60.00元
本书围绕纳米流体的制备方法、聚集结构、输运参数、流动与能量质量传递特性等方面内容, 系统地总结了作者多年来在纳米流体及其应用基础方面的研究工作, 描述了纳米流体的基本属性、流动与能量质量传递特征, 详细介绍了纳米流体流动与能量质量传递的理论和实验研究方法, 重点阐述了纳米流体聚集结构与纳米粒子微运动效应对纳米流体能量质量传递过程的作用机制, 并概述了纳米流体在新型高效散热冷却和节能技术等领域的应用研究进展。
本书可供能源、动力、电子、航空航天、机械、化工、材料等领域从事热科学理论与应用技术的科研和技术人员, 以及大专院校相关专业的师生参考。
道路工程专论
编著:张金喜
出版:科学出版社
定价:78.00元
本书吸纳了国内外道路工程方向的最新研究成果, 以专题的方式系统地介绍了道路工程从设计、施工、使用、养护维修到道路使用性能评价的理论和方法, 阐述了相关领域研究现状和发展趋势。主要内容包括:道路工程发展简史、道路线形设计理论与方法、路基路面设计与施工、道路景观与多功能路面、道路工程病害及防治方法、道路养护与技术状况评价、道路与交通安全、国外沥青路面设计方法简介。
本书可作为交通运输工程和土木工程专业 (道路工程方向) 研究生教材使用, 还可作为交通工程和土木工程专业 (道路工程方向) 本科生参考书和教学参考书使用, 也可供交通、城建、公安等部门从事设计、施工和管理工作的技术人员参考。
能源软科学研究进展
主编:周德群
出版:科学出版社
定价:48.00元
能源问题纷繁复杂, 涉及多学科、多领域的知识。能源问题不仅是资源的开采、加工和利用技术问题, 更是经济问题、社会问题、环境问题和管理问题, 同时还是政治问题。复杂的能源问题已非传统的能源科学与技术 (能源硬科学) 所能解决, 而更多地有赖于能源软科学相关知识的支持。本书是南京航空航天大学产业组织与技术创新研究中心能源软科学研究团队近年来针对能源软科学问题取得的重要研究成果, 内容涉及能源价格与市场、能源效率与环境、能源城市与转型以及能源金融等方面, 在一定程度上反映了能源软科学在相关方向的发展动态, 是一部系统研究能源软科学问题的导读书, 同时也是研究我国能源战略问题的重要参考书。
本书可供政府决策部门、能源政策制定部门、能源经济与管理的研究人员以及关心中国能源发展的人士阅读, 也可作为相关专业研究生的教学参考书。
基于环境一号卫星的生态环境遥感监测
作者:王桥等著
出版:科学出版社
定价:300.00元
相关文章:
简单图书管理系统设计02-22
图书管理系统全套文档02-22
某图书馆自动化系统分析与设计02-22
Oracle课程设计 图书管理系统02-22
图书系统02-22
质量目标汇总02-22
图书管理系统设计与实现-开题报告02-22
图书馆管理系统表设计02-22
1教育心理学考试题02-22
uml图书管理系统需求分析与设计02-22