-
Notifications
You must be signed in to change notification settings - Fork 4
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
大作业说明 #9
Comments
以鸢尾花为例的数据科学过程任务(参考)
以 Github 机器人数据为例的数据科学过程任务(参考)
自选主题的数据科学过程任务流程(参考)1. 选题
例子
随着互联网的普及和电子商务的迅速发展,消费者在线购物已经成为现代社会中不可或缺的一部分。亚马逊作为全球最大的电商平台之一,吸引了数以亿计的用户,其海量数据蕴含了丰富的信息,深入挖掘这些信息对于理解消费者行为、改进用户体验以及提升商业竞争力具有重要的意义。
NBA,作为当今最热门的篮球联赛,随着其快速发展,nba球员的薪资也水涨船高。我们不由得思考,在当今联盟的比赛节奏中,球员的哪些数据更能决定其薪资水平,联盟球员的薪资分布情况。并进一步根据当前赛季的工资帽占比推测出球员的薪资水平。
毫无疑问,B站是中国年轻人使用的最多的视频类网站(软件)。根据bilibili 2023年Q1财报显示,B站日均活跃用户已达9,370万,用户日均使用时长达到96分钟。超过150万UP主(即上传视频者的代称)在B站获得收入,月均投稿量超2,200万。因此,分析B站的每周必看板块的数据以及热点,具有较高的价值。 2. 数据获取网络爬虫方法参考实验手册 API请求方法参考实验手册 数据集网站下载
3. 数据预处理
具体内容可以参考实验手册 4. 数据探索
具体内容可以参考实验手册 5. 数据建模 (可选)
6. 结论部分作品展示完整数据科学流程可视化展示温馨提示
|
示例数据除了鸢尾花数据和github机器人数据,也为大家提供了三个示例数据集: |
另外,课堂的录播回放已经上传到水杉平台了,最后一节课讲解了大作业的内容,同学们可以通过以下网址观看~ |
细则
组队规则:1个人/组
作业内容:完成一个完整的数据作品
时间节点:
提交方式:
参考信息见下
The text was updated successfully, but these errors were encountered: