2018暑假实习总结

2018.09.04

实习结束后就回家了,因为时间短,再加上是最后一个暑假,所以大部分时间都用来陪家人了。开学也有十天了,主要是整理些实习材料还有熟悉下这学期要上的课,看看讲课老师以及课程内容是否有意思。现在重新回忆下短暂的暑期实习吧:

0.实习前
最开始想的是留在学校工作室这边呆一个暑假,临近期末才决定还是去公司实习吧,刚好系里有个老师自己公司缺人,我便找他聊了下,自己目前对Python感兴趣所以想做相关的工作,也把自己的个人博客发给他,可以清晰地看到自己的学习路线以及领域。最后他说去公司后再安排具体岗位。

确定好去公司实习后,便开始跟另一个也去老师那里实习的朋友一起租房子,算是人生第一次租房子吧,又是短租,实属不易。大早上坐公交一两个小时从学校到第一个联系的“房东”那里,从他下车开始到接下来的几分钟聊天,让我觉得这个人不靠谱,等最后他说短租不用签合同的时候,我拉着朋友就走了,我那朋友还蒙在鼓里,因为他差点租下来了,等我分析完刚刚那个人一系列动作表情后,得出是黑中介冒充的结论,他才恍然大悟。然后我们决定跟另外一个在我们附近租房子的同学会和,看他的情况如何。虽然比我们看的那个贵了点,但是感觉房东很靠谱,让房东带着看下房子,又深聊了几句,决定租下。签了合同,付了押金和租金(1000/月),便回学校了。

1.实习中
我实习期间主要做了两个项目,一个是对金融类新闻进行关键词的提取和分类,另一个是爬取福州二手房的信息并做出热力图。

  • 1.1
    刚拿到这个项目的时候,自己觉得任务很艰巨,稍微查了下资料后,是涉及到机器学习的自然语言处理领域的,对于一个仅仅接触过网络爬虫的我,只能硬着头皮开始开始学,查了相关的学习路线后,找到吴恩达的视频开始刷,前面几节课感觉还能应付得来,到了后边涉及到数学的部分就十分吃力,感觉如果这样学下去,一个月什么成果都没有。后来老板带我去甲方那里开会,当时还写了一篇博客,收获的确不小。开完会后没几天,我隔壁的同事突然说,你可以试试百度AI平台,找找有没有现成的工具。我打开后,果然找到了对应的工具,官方文档也极其详细,简单几行代码便可以实现文章关键词的提取以及分类功能,之后的过程就顺利了不少,通过EXCEL处理库直接调用源文件的数据,再跟百度AI的自然语言处理工具相结合便有了初步的成果。通过这件事我也懂得了,如果有现成的工具就不要闭门造车了,特别是对于一些小公司,时间成本以及金钱成本都是极其宝贵的,公司开发人员少的情况下,还在自己造一些东西,无疑只会让公司倒闭的更快。

  • 1.2
    第二个项目就很简单了,我直接用Scrapy对数据进行抓取,经过简单的数据处理就完成任务,交给老板后也很满意。热力图是后来老板提出来的要求,我虽然没做过也直接答应了。有了之前的经验,这次直接找现成的工具,简单的摸索后也完美完成任务,还做了两个热力图:一个关于二手房数量(某个地方数量越多在地图上颜色越鲜艳),另一个关于二手房价格(某个地方价价格越高颜色越鲜艳)。

2.实习后
临近结束的那两天,主要是对实习期间做的东西进行整理,我还写了详细的文件说明,以便看的人理解。正所谓:善始善终。实习期间有几次PPT展示,也锻炼了自己的表达能力,总的来说收获还是很大的。后来因为了解到学校有个很厉害的博士,研究的领域就是大数据,貌似还有个大数据实验室。所以跟公司申请了远程工作,准备回学校继续做公司的项目。