教 程 目 录
敏捷数据科学教程
Agile是一种软件开发方法,可帮助通过使用1到1的短迭代的增量会话来构建软件4周,以便开发与不断变化的业务需求保持一致.敏捷数据科学包括敏捷方法和数据科学的组合.在本教程中,我们使用了适当的示例来帮助您以一般和快速的方式理解敏捷开发和数据科学.
受众
本教程为开发人员和项目经理做好准备,帮助他们了解敏捷原则及其实现的基础知识.完成本教程后,您将发现自己具有中等水平的专业知识,从而可以进一步推进数据科学和敏捷方法的实施.
先决条件
掌握数据科学模块和软件开发概念的基本知识非常重要,如软件需求,编码和测试.
本文地址:https://itbaoku.cn/tutorial/agile_data_science-index.html
相关问答
问 题 先说说我的想法吧:同时监控淘宝上很多物品的价格,然后获取价格走势(这个我打算自己写爬虫获取,然后存在数据库里),但是问题来了 我该怎么存储数据,使我能分析哪些物品在最近2天或7天的价格波动最大(最好是任意天数),这个地方该怎么实现比较好。总不能说每天我都要遍历一次数据库来求价格的差值吧,能不能有经验的大师指点下。 解决方案 总不能说每天我都要遍历一次数据库来求价格的差值吧 是觉得开销过大吗?那就把热点数据放Cache,过了这段热点时间就持久化到数据库。 热点数据可以是但不限于: 这几天刚采集的数据 最常常分析的日期段,比如2天、7天、1个月
)
问 题 如何形象地解释结构化数据与半结构化数据的区别 解决方案 你可以理解为 结构化数据和半结构化数据都是key-value结构的, 只不过结构化中所有数据keyset是相同的固定的, 半结构化中keyset是不固定的, 你永远也不知道哪天会有新key加入
)
问 题 问题是这样的,我有一个博客平台,其中有相册表 album,表结构很简单: id, user_id, name, count_photo 这个 id 是 int 自增主键。 这个时候有个问题,相册本来是可以删除的,假设硬删除,那某个人恶意建了删删了建(虽然相册总数做了限制),id 就会留下许多“空洞”,如果是软删除,那 album 这张表数据会疯涨而且不好控制(限制每天创建数量?)。 我的想法是: id 设置 char(32) ,并根据 [时间 + user_id] 合并后 MD5 得到,正常情况下同一个 user_id 的 [时间] 人为操作并不会重复(大不了再配合 uniqid / mt_rand),而不同用户不同 [user_id] 更不会重复,并且 id 加上 Unique 索引。 这样相册可以直接硬删除,恶意反复删除创建也不会对数据库造成什么影响。 不知道这种方式有没有什么问题?比如可能性能比 int 要差?各位是不是有过这样的实现呢? 解决方案 直接用UUID吧
)
问 题 我想从oracle数据库中导出文本格式的数据,如果在windows系统中可以使用navicat来导出,但是在linux系统中有什么工具或者命令可以导出为文本格式的? ps:我所说的文本格式是指数据文件中是按文本格式存储数据,一行数据就是表中的一行记录,每一行中的每一列使用列分隔符隔开。 解决方案 oracle数据库在linux下运行,但完全可以使用windows的客户端来连接,常用的PL/SQL就可以直接将查询结果导出。 如果非要在linux下导出,可以使用DBCA大神开发的sqluldr2的工具。 如果数据量不大,可以参考下面的sql脚本 --不显示执行的sql语句 set echo off --不显示XX rows selected的行 set feedback off --不显示表头 set heading off --不显示脚本运行结果 set termout off --去掉脚本输出行尾部的空格 set trimspool on --设置pagesize为零,不让oracle进行分页处理 set pagesize 0 --设置每行最大列数 set linesize 10000 --设置列之间的分隔符 set colsep ' ' spool /home/oracle/tj30t.txt SELECT * from bi
)
问 题 有一个合同数据表,设置字段img_url保存路径 需要存放多张图片,改怎么做。新建一个图片子表专门放图片用吗?似乎有点别扭啊。 解决方案 我见过有在一个字段里用分隔符来把每个图片路径分开保存的。 另外就是题主说的用子表来存附件。 (其实整个数据库设计一个公共的附件表,跟其他业务表关联,然后业务表有附件了就往公共附件表里记录,这样也差不多能用)
)
问 题 我有一个比较复习的视图,关联20多张表,而且每个表的数据都在不断变化,近日发觉有时查询视图时报错(什么cast、非法数字转换)等等,过一会又正常,初步确定肯定在某一时刻的数据存在问题,过一会数据正常了,视图也就正常了。现在问题是有没有办法在视图中增加一个捕获错误的代码,比如try...catch之类?单靠查询报错的信息很有限。谢谢 解决方案 视图本身不存储数据,可以简单理解成sql语句的别名,如果sql语句没有语法错误,视图在没有实际执行前是无法判断是否有错误的。 你说的问题主要是数据格式不符合视图的要求造成的,如果想提前进行判断只能在关联表中增加触发器,根据视图中的转换逻辑记录错误的数据行。
)