PaperWeekly十期总结

首先,感谢大家关注PaperWeekly和阅读本文,本文的阅读大概花费您10分钟时间,来看一下PaperWeekly这十期(两个多月)内容走过来所经历的一些。

一开始

PaperWeekly的第一步是从一篇对Andrew Ng的采访开始的,大概的意思是经常读论文是一种非常好的长期投资,回报率也会非常高。虽然之前也在博客上写过一系列《文本文摘》的文章,并有幸得到爱可可老师的转发,但并没有系统地将自己所读的paper进行整理,并写成清晰、简短的文章分享出来。

PaperWeekly最开始的文章都是单篇的文章,源自之前所读的文本摘要的博客,当时取weekly这个名字是因为想给自己留下一个偷懒的借口,毕竟一周写一篇压力不会太多,如果心血来潮或者闲暇时间多的话可以写几篇。

慢慢地养成了刷arxiv的习惯,刷的方向主要包括:cs.CL、cs.AI、cs.LG和cs.NE这四个,最多的是cs.CL。习惯是个可怕的东西,养成了之后是很难改,每天不到arxiv上看看,就会感觉生活缺了点什么。

闻道有先后,术业有专攻。我个人的眼界和所关注的东西是有限的,精力也是有限的,所以在挣扎了一段时间之后,终于决定打开大门,欢迎同样对自然语言处理和分享知识感兴趣和有热情的同学一起来做PaperWeekly,让更多对其他领域更加专业的同学加入进来,来丰富内容,同时也会保证更高的质量,目前PaperWeekly有30名左右的童鞋一起来写文章,根据应用领域分了四个组,小组只是为了方便组织一期一期的topic,这里欢迎有更多感兴趣的同学可以加入,来增加更多的组,来写更多不同形式、不同领域的文章。

算上开始我个人写的两期,到昨天发布的最新一期,一共是十期内容。十期,是我给自己定的一个小目标。当我决定让更多的人参与进来时,我给自己设定了一个小目标,就是成功运营到第十期。想一件事情很简单,说一件事情也不难,难的是做出来,并且可以坚持一直做下去。从第三期的ACL值得读,新团队小试牛刀,再到后面的一个小组一期内容,每一期内容都围绕一个topic展开,从最开始的缺乏各种规范,到现在有了一个稳定的、但不是那么健全的制度来确保运营和沟通的高效,我感觉的到PW每天都在成长,每天都在朝着一个更好的方向走着,虽然仍存在在各种各样的不足,但它在进步,并且在不断努力变得更好。

公众号+微信群

公众号+微信群的模式带来了很多的方便,最初的想法是让对PW感兴趣的童鞋聚在一起,可以对某些感兴趣的topic进行讨论。微信群有个天然的优势在于用户粘性高,不管什么样的问题,大家都喜欢丢在群里讨论,但也有天然的劣势,讨论过程容易混乱,尝试过用slack来解决这个问题,slack的分组讨论功能非常适合我们的场景,但并没有培养出来这个使用习惯,就是因为微信的粘性太高了,大家就是喜欢在这里交流。

Issue 1

一个群很快就到了500人,出现了一个棘手的问题,第二个群的人如果太少,几乎没有讨论意义,所以就想用什么办法可以打通两个群,让两个群的童鞋在同一时空内进行交流。抛出这个问题之后,大家给出了很多的建议,最后群里优秀的工程师@碱馒头童鞋做了一个消息转发机器人,并且牺牲了自己的微信号,每天给大家转发来自两个群里的每一条消息。

Issue 2

群里常常会有很多精彩的讨论和高质量的问答内容,是一笔不小的资源财富,如何让这些资源保存并且整理下来是一个很有挑战性的问题。最开始的想法是,可不可以做一个文本摘要工具,每天从群里摘要出有意义的东西,如果有QA对,整理出QA对。将问题抛到群里之后,大家也是各种讨论,但最后还是拿不出一个靠谱的方案来。我们整天都在用机器学习,也都想通过人工智能来改变这个世界,来改变我们的生活,很多时候模型和工具都有,但缺少数据和需求,这次有了数据和需求,我们却无能为力了,感觉有一点点小讽刺。

后来换了个思路,可不可以通过一些特殊标记,将大家的QA对转发到另一个地方,并且组织起来内容。我想到了bbs,想法很简单,就是大家把Q和A都通过一些标记起来,通过一个小bot将信息转发到bbs的数据库中,通过bbs来保存这些讨论信息。在群里抛出这个问题后,有童鞋响应,并且想做一些尝试,他就是现在群里的转发机器人@种瓜 童鞋,一个非常喜欢钻研问题的童鞋,他是一个blogger,这里是他的博客地址http://blog.just4fun.site/ 。通过他的努力,群里添加了一个看起来很酷的bbs bot,很酷,但最终仍然没有改变大家的习惯,毕竟提问的童鞋并没有太高的期待,因为这个群没有人回答,他转身就会将问题扔到另一个群,总会有人回答他的,所以强行推广使用bbs bot很难,而且bbs bot会自动产生一些状态信息,会显得群里有一些杂乱。所以,现在bbs bot成了群里的一个彩蛋,一个好玩的东西,虽然没有被广泛应用,但我仍觉得这是一件很酷的事情。(现在bot火,很多平台上驻扎了大大小小的bot上万只,但有几只bot可以产生用户粘性呢?大多数都是现象级,从这个角度来看,改变一个用户的习惯是多么困难的一件事情!)

说到彩蛋,群里还有一个彩蛋,就是一个基于StackOverFlow的QA bot,通过特定的表情符号来提问,系统会返回一个相关的答案,实现的大概思路是用google在stack上找答案,然后取排名最高的答案返回给用户,为了让群里的童鞋可以用中文来提问,特意加了一层翻译功能。

好玩的事情一、两个人在没意思,要是有更多感兴趣的童鞋可以加入,功能将会更加丰富和实用。(有感兴趣的童鞋可以私信我)

一些时间点

2016.05.08 PW发布第一篇文章,《Generating News Headlines with Recurrent Neural Networks》

2016.08.05 PW发布第一期文章,包括三篇文章:《DeepIntent: Learning Attentions for Online Advertising with Recurrent Neural Networks》、《A Neural Knowledge Language Model》、《Neural Sentence Ordering》

2016.09.01 PW发布组建团队后的第一期文章,包括十篇ACL 2016的paper

2016.09.17 PW在群里正式上线了一个同步消息的bot,感谢@碱馒头 童鞋

2016.09.29 PW在群里正式上线了一个bbs bot,感谢@种瓜 童鞋

2016.10.07 PW在群里正式上线了一个QA bot,感谢@种瓜 童鞋

一些数字

PW在上线运营的这小半年以来,一共:

发布了113篇文章

完成了101篇paper的解读

推荐了80篇高质量paper

分享了20个高质量资源

吸引了30位学生和工程师参与写文章

接下来

PW永远都处在beta状态,可能变化地很慢,但一定在努力朝着一个正确的方向改变。于是,PW在原有基础上有了一些新的思路:

定位:
1、对于学术界,推荐最新的高质量paper,起到一个导读作用;同时以topic为牵引,归纳和总结相似topic的paper。
2、对于工业界,推荐实用的或者新颖的paper,起到一个介绍作用;同时不定期的约稿写文章,系统地讲某一个领域、剖析某一个框架、精讲某一篇文章等等等等。

模式:
1、小组(不定期):同之前一样,发起一个topic,做几篇相关的文章,形式变化不大。
2、arXiv(定期):写作形式与之前一样,每周从arXiv上过滤出几篇高质量文章(PaperWeekly官方微博上每天过滤出的好paper作为候选),以周为单位解读最新的paper给大家。
3、约稿(不定期):写作形式不限,可详细解读一篇文章,可写一个方向(比如:文本摘要),也可以与代码、框架有关的内容,也期待大家的投稿。

致谢

十期内容,经历了两个多月的时间,60多天是一段漫长的时间,感谢大家的一路相伴和支持。

感谢踊跃加入PW写作团队的你们:magic282sub、陈哲乾、destinwang、yangzhiye、david、brantyz、AllenCai、anngloves、cheezer94、tonya、gcyydxf、guoxh、EdwardHux、hxw2303632、jaylee1992、jian.zhou.cool、lshowway、memray、mygod9、美好时光海苔、cain、王迁、xy504、Susie-nmt、褚则伟、zhang1028kun、zhaosanqiang、zhaoyue、zhoussneu、zeng
,也期待更多的童鞋可以加入写作团队。

感谢加入PW讨论群的童鞋,感谢你们贡献了很多精彩的讨论。

感谢机器之心的支持和宣传,看着你们一路走来,逐渐地成长和壮大,有一种榜样的力量!

感谢帮忙分享和推广的各种大牛们,谢谢你们让更多的人知道了PW。

感谢留言提意见的童鞋们,有时时间紧张,不能一一回复,有时精力有限,无法满足每一位的需求,但还是感谢你们的期待和支持!

第一个十期结束了,我不知道后面会有多少个十期,希望可以一直坚持做下去。放弃可以找到很多种借口,但坚持下来只需要一个理由,因为热爱!

PW Ebook

我将PW的十期内容汇总成一本电子书,大家可以从http://www.kancloud.cn/mcgrady164/paperweekly 下载阅读,里面的文章会随着PW的更新不断地更新。

广告时间

PaperWeekly是一个分享知识和交流学问的民间组织,关注的领域是NLP的各个方向。如果你也经常读paper,也喜欢分享知识,也喜欢和大家一起讨论和学习的话,请速速来加入我们吧。

微信公众号:PaperWeekly
微博账号:PaperWeekly(http://weibo.com/u/2678093863
知乎专栏:PaperWeekly(https://zhuanlan.zhihu.com/paperweekly
微信交流群:微信+ zhangjun168305(请备注:加群 or 加入paperweekly)