- [fix] 修复了由于 img 的 title 属性修改为 alt 属性造成的 Author.followed_topic 获取前几个话题出错的 bug
- [add] Question 和 Answer 添加 deleted 属性
- [fix] 修复了问题没有回答时 Question.answers 出错的问题
- [fix] 修复了回答仅有一页时无法获取按时间排序的答案的问题
- [fix] 修复无法刷新 answer_num 的问题
- [fix] 修复收藏为0时获取收藏数出错的问题
- [fix] 知乎修改了评论的前端代码
- [change] Comment 类现在也提供 datetime.datetime 类型的 creation_time 属性, 去掉 time_string
- [fix] 修复了 topic.question 由于时间戳乘以了 1000 而造成的错误
- [fix] 修复了 topic.top_answer 无法获取到内容的 bug
- [fix] 修复了 topic.hot_answer 无法获取到内容的 bug
- [add] Answer 和 Question 增加 refresh() 方法, 刷新问题答案 object 的属性
- [add] Question 初始化的 url 现在支持 ?sort=created
- [add] 使用带 ?sort=created 的 url 初始化问题时, question.answers 按照时间顺序返回答案
- [add] 添加了 Answer.comment_num 属性, 获取评论数量
- [add] 添加了 Collection.id 属性
- [fix] 现在 Activity.type 变成 read-only property 并加入文档了
全都 Thanks @laike9m
- [fix] 修复了用户动态中有关注圆桌行为时会崩溃的 Bug(目前暂时跳过这类动态)。
- [fix] 知乎删除了深网话题,正好Topic类是用的那个话题测试,我还以为代码bug了……现在改成测试「程序员」话题。
- [add] 曾加了获取专栏文章点赞者的功能。
- [fix] 修试图获取登录用户自身 location, business 等属性但自己又未填写时出现的 bug
- [fix] 修复 topic.py 中混合使用 return sth 和 yield sth 导致的旧版本 python 报语法错误的问题
- [add/fix] ActType 中添加了关注收藏夹 (Thanks @cssmlulu)
- [fix] 修复了 Author.activities 项 answer 的 author 属性不正确的 bug (Thanks @cssmlulu)
- [add] 添加 Answer.collect_num 属性, 获取答案的收藏数
- [add] 添加 Answer.collections 接口, 获取收藏了该答案的收藏夹
- [add] 添加 Collections.logs 接口, 获取收藏夹日志
- [add] 添加 Question.author 属性,获取提问者
- [fix] 修复文档代码的一些错误
前四个功能Thanks @laike9m
- [f**K] 随便在知乎上发了个小专栏……不小心就进撕逼大战了 QAQ 我好方~
- [add] 增加了 example 文件夹,里面放一些实例
- [add] Add answer creation_time attribute(Thanks @laike9m)
- [add] 添加 Question.creation_time 和 Question.last_edit_time 属性(Thanks @laike9m)
- [fix] 修复了 UPVOTE_ANSWER 型的 Activity 的 act.answer.author 全都是匿名用户的 bug(不知道是不是前端改了)
- [fix] 紧急更新,知乎页面上的链接大多数都变成了 https, 暂时只简单的改了一点正则表达式已作为紧急应对,有 bug 请开 issue。
- [change] 改变 Author 类获取 Activities 的机制,判断类型更准确(Thanks @laike9m)。
- [change] 为方便以后写测试,类架构修改为均继承 BaseZhihu 类(Thanks @littlezz)。
- [fix] 修复因为知乎 Answer 的 css class 更改导致的 Answer 类 content 属性获取不正确的 bug
- [fix] 修复历史遗留代码造成使用 profile card 获取头像时,网址不正确的 bug(Thanks @bdqy)
- [fix] 修复因答案被和谐造成的 bug(Thanks @littlezz)
- [add] 获取用户的一些详细信息,包括微博,所在地,教育情况,所在行业等等(Thanks @zeroxfio)
- [add] Answer 类增加了获取答案的评论的功能(Thanks @zeroxfio)
- [add] Me 类增加了发送私信和评论的功能(Thanks @zeroxfio)
- [add] Me 类增加了给答案点没有帮助的功能(Thanks @lishubing)
- [add] Me 类增加了屏蔽用户,屏蔽话题的功能(Thanks @lishubing)
- [fix] 修复 Author 类的 get_followed_columns 接口获取到的 Column 对象调用 followed_num 函数可能获取不到正确数量的 bug
- [fix] 修复 Author 类的 get_followed_columns 接口获取到的 Column 对象处于未登录状态的 bug
- [add] Author 类增加获取用户关注的话题数的接口(followed_topic_num)
- [add] Author 类增加获取用户关注的话题的接口 (followed_topics)
- [fix] 修复因问题描述和答案使用相同的 class 造成的答案内容与序号不同的 bug。
- [tucao] 一天修三四个bug好累……我估计得找时间抓一下知乎的移动端 API 了,前端天天变这谁受得了。
- [fix] 上次的 bug 修复的不完全,匿名用户的情况没有考虑周全,紧急修复下……(可能还有地方没修复,请关注更新。
- [fix] 修复由于把用户 tag 从 h3 改成了 div 造成的一系列 bug (Thanks @lishubing)
- [fix] 获取匿名用户的ID出错的问题,暂定为返回空字符串
- [add] 增加获取用户关注专栏数的功能 (Thanks @cssmlulu)
- [add] 增加获取用户关注专栏的功能 (Thanks @cssmlulu)
- [fix] 修复了某些问题无法获取答案的bug
- [fix] 知乎又把头像链接改回去了。。。
- [fix] 知乎修改了图片链接的格式,影响了答案图片,头像。
- [fix] Topic.hot_question 的顺序 Bug
- [fix] 知乎登录逻辑修改(?)
- [add] Topic 所有答案接口
- [add] Topic 热门答案接口
代码美化,尽量满足 PEP8.
增加 Topic 类的最近动态(热门排序) 修复 Topic.children 的bug
增加Me类及其相关操作
- [x] 点赞,取消点赞,反对,取消反对某回答
- [x] 点赞,取消点赞,反对,取消反对某文章
- [x] 感谢,取消感谢某回答
- [x] 关注,取消关注某用户
- [x] 关注,取消关注某问题
- [x] 关注,取消关注某话题
- [x] 关注,取消关注收藏夹
增加Topic类相关操作:
- [x] 获取话题名称
- [x] 获取话题描述
- [x] 获取话题图标
- [x] 获取关注者数量
- [x] 获取关注者
- [x] 获取父话题
- [x] 获取子话题
- [x] 获取优秀答主
- [ ] 获取最近动态(暂缓)
- [x] 获取精华回答
- [x] 获取所有问题
- 增加了获取收藏夹关注者的功能
- 增加了获取问题关注者的功能
- Column的一个小Bug修复
知乎登录参数变化,从rememberme变成了remember_me,做了跟进。
发布到Pypi.
- 重构项目结构
- 增加 zhihu.Client 类,改善原先模块需要使用当前目录下 cookies 的弊端,现在的使用方法请看 Readme 中的示例。
- 去掉了 _text2int 方法,因为发现知乎以K结尾的赞同数也有办法获取到准确点赞数。
重构项目结构,转变为标准 Python 模块结构。
添加 Author.photo_url 接口,用于获取用户头像。
本属性的实现较为分散,在不同的地方使用了不同的方法:
- Author.follower(e)s, Answer.upvoters 等属性返回的 Author 自带 photo_url
- 用户自定义的 Author 在访问过主页的情况下通过解析主页得到
- 用户自定义的 Author 在未访问主页的情况下为了性能使用了知乎的 CardProfile API
因为实现混乱所以容易有Bug,欢迎反馈。
Author.followers, Author.folowees 返回Author迭代器,自带url, name, motto, question_num, answer_num, upvote_num, follower_num属性。
在安装了 lxml 的情况下默认使用 lxml 作为解析器,否则使用 html.parser。
Author.upvoters 返回 Author 迭代器,自带url, name, motto, question_num, answer_num, upvote_num, thank_num属性
Author.is_zero_user() ,判断标准为,赞同,感谢,提问数,回答数均为 0。
暂时这样吧,有点懒了,因为这样会让使用者有机会非法修改 url,可能导致 Bug,以后勤快的话会改成 read-only。
专栏类从 Book 更名为 Cloumn
文章类从 Article 更名为 Post
以上两个更名同时影响了其他类的属性名,如 Author.books 变更为 Author.columns,其他类同理。
1. 统一了一下复数的使用。比如 Author.answers_num 变为 Author.answer_num, Author.collections_num 变为 Author.collection_num。 也就是说某某数量的接口名为 Class.foo_num,foo使用单数形式。
- 知乎的赞同使用单词 upvote,以前叫 agree 的地方现在都叫 upvote。比如 Author.agree_num 变为 Author.upvote_num,Post.agree_num 变为 Post.upvote_num。
- Answer 类的 upvote 属性更名为 upvote_num。
目前只有获取话题名的功能。
属性获取用户动态,返回 Activity 类生成器。
Activity 类提供 type 属性用于判断动态类型,type 为 ActType 类定义的常量,根据 type 的不同提供不同的属性,如下表:
类型 | 常量 | 提供的成员 |
---|---|---|
关注了问题 | FOLLOW_QUESTION | question |
赞同了回答 | UPVOTE_ANSWER | answer |
关注了专栏 | FOLLOW_COLUMN | column |
回答了问题 | ANSWER_QUESTION | answer |
赞同了文章 | UPVOTE_POST | post |
发布了文章 | PUBLISH_POST | post |
关注了话题 | FOLLOW_TOPIC | topic |
提了一个问题 | ASK_QUESTION | question |
由于每种类型都只提供了一种属性,所以所有Activity对象都有 content 属性,用于直接获取唯一的属性。
示例代码见 zhihu-test.py 的 test_author 函数。
activities 属性可以在未登录(未生成cookies)的情况下使用,但是根据知乎的隐私保护政策,开启了隐私保护的用户的回答和文章,此时作者信息会是匿名用户,所以还是建议登录后使用。
尝试修复了最新版bs4导致的问题,虽然我没明白问题在哪QuQ,求测试。
重构 Answer 和 Article 的 url 属性为 public.
Hotfix, 知乎更换了登录网址,做了简单的跟进,过了Test,等待Bug汇报中。
由 @Gracker 补充了在 Ubuntu 14.04 下的测试结果,并添加了补充说明。
修复了当问题关注人数为0时、问题答案数为0时的崩溃问题。(感谢:@段晓晨)