Hike News

Assessment-and-Progress-Records

引子

自己大二上其实课程很少,但是也是显得很忙的样子,每天忙忙碌碌疲倦不堪,沉浸在「我很累」的自我陶醉里,也不知道到底在忙什么。最近很开心被靠谱的同学和超赞的导师拉入了计算新闻组,于是大概可以静下心,开篇婆婆妈妈的博客记录一下学习进度,以后也方便回忆那年的那段时间自己做了什么。


记录正文

11.29-12.05

新人入组,第一个任务也许算老人眼里的简单,不过也够我们新人喝一壶。学长给了他写好的 py2 爬虫代码,让我和专题组的玥璇每人负责爬 5 类。吃老本改了 UA、Cookie,找微博 repostTimeline 的 api,终于跑通了代码。但是单个爬起来很慢,这个时候脑子第一个想法就觉得可以使用 screen 命令,脑子里又飘过了 systemd,但是又不会(一年前就不会,懒哭了),这点存疑。

第二点肯定有的想法是,心疼自己电脑+害怕突然断网+晚上电脑要合上盖子,于是就想丢在 VPS 里面跑,但是跑完的结果如何下载呢?第一反应是 eq 维护的 caddy,可是害怕自己不会配置浪费时间(事实上这歩真的走错了,当时就应该用 caddy 的),就想到了之前下载 searching 那部电影时候用过 Nginx,结果退步的自己浪费 2h 也没搞好,最后找我的红心苕 ssh 进来修好了,大概是我配置文件写错了,而且位置也错了。总之一天半的折腾后,终于及时交差,等着明天的组会安排下周任务。买的 py 书到了,可惜还没看,最近期末事情越来越多欸……

12.06-2.12

残忍的期末考和愉快的春节期间,断断续续也接了几个学长安排的任务,大部分和上次一样,都是爬微博转发 + 评论 + 用户,另外一个附加任务是学习并自己写某指定网站的评论爬取代码,我选择了知乎,当时遇到了一点点小问题,现在另开一个博客文章记录一下。说实话以前没有好好看过 py 语法,寒假拿出几天时间把之前买的书前十章看完了,应该还是有点浅,不过一些小细节也是曾经完全不知道的。也准备另开一文整理一下。想要深入的话,https://python3-cookbook.readthedocs.io/zh_CN/latest/index.html 立 flag 看完 cookbook。