1. 研究目的与意义
随着我国的经济发展,对于人们的娱乐方式也有很大的变化,现在的人们大部分选择为看视频解闷,但是由于视频网站以及视频创作者的增多,网站上面的视频是海量的更新,热点不断的出现,引的人们是应接不暇,所以无论是对于视频创作者,快速的知道视频热点是必须的,而对于普通群众,准确的找到相关信息也是非常重要的,单就热门视频网站哔哩哔哩来说,付费用户以及到了2000万的高位,而对于视频网站的搜索引擎,大部分的搜索引擎只是局限于搜索关键词,只适合准确的视频搜索,不适用视频信息的观看。
所以现在需要一个搜索系统,提取视频中相关的信息,并且从和视频相关的文本,来判断一个视频是属于什么样的类型的,并且建立视频信息的汇总,创建表格或者是图表来快速的展示视频热点。方便用户进行观看。并且用户可以选择将视频下载到本地,来进一步的观看视频。
2. 课题关键问题和重难点
基于爬虫的网络视频进行抓取与分析系统分为四个大模块:基于网页中热门视频的获取、视频相关文字的获取、基于获取视频的信息进行分类汇总、以及制作图表和表格、基于视频信息显示系统前端实现。本课题拟完成基于网络视频进行抓取与分析后台的设计与实现 。
本课题的关键:
3. 国内外研究现状(文献综述)
2021年B站创作者群体迅速壮大,月均活跃UP主已达270万,同比增长61%。
2022年b站会员持约2000万高位,增速放缓5至19%。而不是会员数目用户也在同步增长。
2022年,热点视频播放量每月高达4000亿,而每月被创作出来的热点视频数量突破百万。其中,社会、娱乐类最为聚焦,而在如此庞大的内容数量背后,是抖音热点正在与用户生活形成紧密连接。
4. 研究方案
四、方案论证 1. 系统功能结构 系统总体功能结构如图1所示
图1爬虫视频分析系统功能结构
爬虫视频系统 用户注册:用来注册用户,添加系统的使用者 登录界面:登录用户界面,用户输入账号密码进行系统登录 主界面:该界面是显示系统中的功能,用户可以选择爬虫播放视频界面和主页视频界面 主页视频界面:该功能是对于视频网站主页的视频进行分析,并且输出数据 详细视频信息查询界面:输入播放视频的网站,分析视频页面中的文字信息。 视频信息展示界面:展示分析后的视频文字信息的总结,并且加以一定的修饰,方便用户阅读。 用户管理界面:用来管理注册成功的用户,对用户的信息进行增删改查。
2.核心功能流程图 3.研究方案
数据库设计 E-R图
各个表如下 用户表(id、账号、密码) 视频表(播放量、弹幕、评论、时长、…) 图表(图id、对比图、可视化图片、…) 基于爬虫的网络视频进行抓取与分析的系统后台的设计与实现主要分为三个部分 1)爬虫程序的设计:如何设计好的爬虫流程,是方便数据采集的,而技术的不同对于爬虫的速度有着很大的影响。 2)系统界面的设计:在系统界面上如何设计出简洁的界面,用户一眼看到重要的信息,以及如何找到自己需要的信息 3)爬虫信息展示:如何展示可视化的信息,如何处理数据以及图表如何创建并且展示。
|
5. 工作计划
五、工作计划
2022-2023-1学期:
第15-16周:完成选题,查阅相关中英文资料,进行相关技术的学习;
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。