当前位置:首页 > 专题范文 > 学习强国 > Python学习总结(DOC34页)

Python学习总结(DOC34页)

发布时间:2022-08-17 14:20:04 来源:网友投稿

下面是小编为大家整理的Python学习总结(DOC34页),供大家参考。

Python学习总结(DOC34页)

 

 Python 学习总结(DOC34 页)

 名目 Python 总结 ..................................................................................... 错误!未定义书签。

 前言 ............................................................................................................................. 2 〔一〕如何学习 Python ......................................................................................... 2 〔二〕一些 Python 免费课程举荐 ....................................................................... 4 〔三〕Python 爬虫需要哪些知识? .................................................................... 5 〔四〕Python 爬虫进阶 ......................................................................................... 8 〔五〕Python 爬虫面试指南 .............................................................................. 11 〔六〕举荐一些不错的 Python 博客 ................................................................. 13 〔七〕Python 如何进阶 ....................................................................................... 14 〔八〕Python 爬虫入门 ....................................................................................... 16 〔九〕Python 开发微信公众号 .......................................................................... 20 〔十〕Python 面试概念和代码 .......................................................................... 24 〔十一〕Python 书籍 ........................................................................................... 34

 前言

 在知乎分享差不多有一年多了,之前一直有朋友说我的回答能整理成书籍了,一直偷懒没做,最近有空认真整理了知乎上的回答和文章另外也添加了一些新的内容,完成了几本小小的电子书,这一本是有关于 Python 方面的。

 还有另外几本包括我的一些数据分析方面的读书笔记、增长黑客的读书笔记、机器学习十大算法等等内容。将会在我的微信公众号:一个程序员的日常进行更新,同时也能够关注我的知乎账号:路人甲及时关注我的最新分享用数据讲故事。

 〔一〕如何学习 Python 学习 Python 大致能够分为以下几个时期:

 1.刚上手的时候确信是先过一遍 Python 最差不多的知识,比如说:变量、数据结构、语法等,基础过的专门快,差不多上 1~2 周时刻就能过完了,我当时是在这儿看的基础:Python 简介 | 菜鸟教程

 2.看完基础后,确实是做一些小项目巩固基础,比方说:做一个终端运算器,假如实在找不到什么练手项目,能够在 Codecademy - learn to code, interactively, for free 上面进行练习。

  3. 假如时刻充裕的话能够买一本讲 Python 基础的书籍比如«Python 编程»,阅读这些书籍,在巩固一遍基础的同时你会发觉自己诸多没有学习到的边边角角,这一步是对自己基础知识的补充。

 4.Python 库是 Python 的精华所在,能够说 Python 库组成同时造就了 Python,Python 库是 Python 开发者的利器,因此学习 Python 库就显得尤为重要:The Python Standard Library ,Python 库专门多,假如你没有时刻全部看完,不妨学习一遍常用的 Python 库:Python 常用库整理 - 知乎专栏

 5.Python 库是开发者利器,用这些库你能够做专门多专门多东西,最常见的网络爬虫、自然语言处理、图像识别等等,这些领域都有专门强大的 Python 库做支持,因此当你学了 Python 库之后,一定要第一时刻进行练习。如何查找自己需要的 Python 库呢?举荐我之前的一个回答:如何找到适合需求的 Python 库?

 6.学习使用了这些 Python 库,现在的你应该是对 Python 十分中意,也十分兴奋能遇到如此的语言,确实是那个时候不妨开始学习 Python 数据结构与算法,Python 设计模式,这是你进一步学习的一个重要步骤:faif/python-patterns

 7.当度过艰巨的第六步,现在选择你要研究的方向,假如你想做后端开发,不妨研究研究 Django,再往后,确实是你自己自由发挥了。

 〔二〕一些 Python 免费课程举荐 以下课程都为免费课程

 1.python 零基础相关 适用人群:Python 零基础的初学者、Web 开发程序员、运维人员、有志于从事互联网行业以及各领域应用 Python 的人群

  疯狂的 Python:快速入门精讲  零基础入门学习 Python  玩转 Python 语言  Python 语言程序设计  程序设计入门  可汗学院公布课:运算机科学  python 入门到熟知  Python 交互式编程入门的课程主页  Python 交互编程入门〔第 2 部分〕的课程主页

 2.python web 方向

 Python Django 快速 Web 应用开发入门

 3.python 爬虫 Python 实战:一周学会爬取网页

 4.python 数据分析方向 数据分析实战基础课程

  〔三〕Python 爬虫需要哪些知识? 要学会使用 Python 爬取网页信息无外乎以下几点内容:

 1、要会 Python 2、明白网页信息如何出现 3、了解网页信息如何产生 4、学会如何提取网页信息 第一步 Python 是工具,因此你必须熟练把握它,要把握到什么程度呢?假如你只想写一写简单的爬虫,不要炫技不考虑爬虫效率,你只需要把握:

  数据类型和变量  字符串和编码  使用 list 和 tuple

  条件判定、循环  使用 dict 和 set

  你甚至不需要把握函数、异步、多线程、多进程,因此假如想要提高自己小爬虫的爬虫效率,提高数据的精确性,那么记住最好的方式是去系统的学习一遍Python,去哪儿学习?Python 教程 假设差不多熟悉了最基础的 Python 知识,那么进入第二步:明白网页信息如何出现?你第一要明白所需要抓取的数据是如何样的出现的,就像是你要学做一幅画,在开始之前你要明白这幅画是用什么画出来的,铅笔依旧水彩笔...可能种类是多样的,然而放到网页信息来说这儿只有两种出现方式:

 1、HTML 〔HTML 简介〕 2、JSON 〔JSON 简介〕 HTML 是用来描述网页的一种语言 JSON 是一种轻量级的数据交换格式 假设你现在明白了数据是由 HTML 和 JSON 出现出来的,那么我们紧接着第三步:数据如何来?数据因此是从服务器反馈给你的,什么缘故要反馈给你?因为你发出了要求。

 〝Hi~ ,服务器我要那个资源〞 〝正在传输中...〞 〝差不多收到 HTML 或者 JSON 格式的数据〞

 那个要求是什么要求?要搞清晰这一点你需要了解一下

 的基础知识,更加精确来说你需要去了解 GET 和 POST 是什么,区别是什么。也许你能够看看那个:浅谈

 中 Get 与 Post 的区别 - hyddd - 博客园 专门快乐你使用的是 Python,那么你只需要去把握好快速上手 - Requests 2.10.0 文档,requests 能够帮你模拟发出 GET 和 POST 要求,这真是太棒了。

 饭菜差不多备好,两菜一汤美味佳肴,下面确实是好好享受了。现在我们差不多拿到了数据,我们需要在这些错乱的数据中提取我们需要的数据,这时候我们有两个选择。

 第一招:万能钥匙 Python 正那么表达式指南 ,再大再乱的内容,哪怕是大海捞针,只要告诉我那个针的模样我都能从茫茫大海中捞出来,强大的正那么表达式是你提取数据的不二之选。

 第二招:笑里藏刀 Beautiful Soup 4.2.0 文档,或许我们有更好的选择,我们把原始数据和我们想要的数据的模样扔个那个 Beautifulsoup,然后让它帮我们去查找,这也是一个不错的方案,然而论灵活性,第二招依旧略逊于第一招。

 第三招:双剑合璧 最厉害的招式莫过于结合第一招和第二招了,打破天下无敌手。

 基础知识我都会,但是我依旧写不了一个爬虫啊!

 客观别急,这还没完。

 以下这些项目,你拿来学习学习练练手。

 一些教学项目你值得拥有:

  03. 豆瓣电影 TOP250  04. 另一种抓取方式

 还不够?这儿有专门多:

  知乎--你需要这些:Python3.x 爬虫学习资料整理  如何学习 Python 爬虫[入门篇]? - 知乎专栏  知乎--Python 学习路径及练手项目合集

 〔四〕Python 爬虫进阶 爬虫无非分为这几块:分析目标、下载页面、解析页面、储备内容,其中下载页面不提。

 1. 分析目标 所谓分析确实是第一你要明白你需要抓取的数据来自哪里?如何来?一般的网站一个简单的 POST 或者 GET 要求,不加密不反爬,几行代码就能模拟出来,这是最差不多的,进阶确实是学会分析一些复杂的目标,比如说:淘宝、新浪微

 博登陆以及网易云的评论信息等等。

 2. 解析页面 解析页面要紧是选择什么库或者那些库结合能使解析速度更快,可能你一开始你通过种种地点了解到了 bs 库,因此你对那个库专门迷恋,以后只要写爬虫,总是先写上:

 importrequests frombs4importBeautifulSoup 因此 bs 差不多专门优秀了,然而并不代表能够用正那么表达式解析的页面还需要使用 bs,也不代表使用 lxml 能解决的还要动用 bs,因此这些解析库的速度是你在进阶时要考虑的问题。

 3. 储备内容 刚开始学爬虫,一样爬取的结果只是打印出来,最后把在终端输出的结果复制粘贴储存就好了;后来发觉苦恼会用上 xlwt/openpyxl/csv 的把储备内容写入表格,再后来使用数据库 sqlite/mysql/neo4j 只要调用了库都专门简单,因此这是入门。

 进阶要开始学习如何选择合适的数据库,或者储备方式。当爬取的内容过千万的时候,如何设计使储备速度更快,比如说当既有人物关系又有人物关系的时候,

 一定会用 neo4j 来储备关系,myslq 用来储备用户信息,如此分开是因为假如信息全部存入 neo4j,后期的储备速度经十分的慢。

 当你每个步骤都能做到专门优秀的时候,你应该考虑如何组合这四个步骤,使你的爬虫达到效率最高,也确实是所谓的爬虫策略问题,爬虫策略学习不是一朝一夕的情况,建议多看看一些比较优秀的爬虫的设计方案,比如说 Scrapy。

 除了爬取策略以外,还有几点也是必备的:

 1. 代理策略以及多用户策略 代理是爬虫进阶时期必备的技能,与入门时期直截了当套用代理不同,在进阶时期你需要考虑如何设计使用代理策略,什么时候换代理,代理的作用范畴等等,多用户的抓取策略考虑的问题差不多上与代理策略相同。

 2. 增量式抓取以及数据刷新 比如说你抓取的是一个酒店网站关于酒店价格数据信息的,那么会有这些问题:酒店的房型的价格是每天变动的,酒店网站每天会新增一批酒店,那么如何进行储备、如何进行数据刷新差不多上应该考虑的问题。

 3.验证码相关的一些问题 有专门多人提到验证码,我个人认为验证码不是爬虫要紧去解决的问题,验证码不多的情形考虑下载到本地自己输入验证码,在多的情形下考虑接入打码平台。

 〔五〕Python 爬虫面试指南 前段时刻快要毕业,而我又不想找自己的老本行 Java 开发了,因此面了专门多Python 爬虫岗位。因为我在南京上学,因此我一开始只是在南京投了简历,我一共面试了十几家企业,其中只有一家没有给我发 offer,其他企业都情愿给到10K 的薪资,不要拿南京的薪资水平和北上深的薪资水平比较,结合面试常问的问题类型说一说我的心得体会

  第一点:Python 因为面试的是 Python 爬虫岗位,面试官大多数会考察面试者的基础的 Python知识,包括但不限于:

  Python2.x 与 Python3.x 的区别  Python 的装饰器  Python 的异步  Python 的一些常用内置库,比如多线程之类的

 第二点:数据结构与算法 数据结构与算法是对面试者专门是校招生面试的一个专门重要的点,因此小公司可不能太在意这些,从目前的聘请情形来看对面试者的数据结构与算法的重视程度与企业的好坏成正比,那些从不问你数据结构的你就要当心他们是否把你当码

 农用的,因此以上情形不绝对,最终说明权归面试官所有。

 第三点:Python 爬虫 最重要也是最关键的一点因此是你的 Python 爬虫相关的知识与体会储备,这通常也是面试官考察的重点,包括但不限于:

  你遇到过的反爬虫的策略有哪些?  你常用的反反爬虫的方案有哪些?  你用过多线程和异步吗?除此之外你还用过什么方法来提高爬虫效率?  有没有做过增量式抓取?  对 Python 爬虫框架是否有了解?

 第四点:爬虫相关的项目体会 爬虫重在实践,除了理论知识之外,面试官也会十分注重爬虫相关的项目:

  你做过哪些爬虫项目?假如有 Github 最好  你认为你做的最好的爬虫项目是哪个?其中解决了什么难题?有什么专门之处?

 以上是我在面试过程中,会碰到的一些技术相关的问题的总结,因此面试中不光是技术这一点,然而关于做技术的,过了技术面差不多上确实是薪资问题了。

 〔六〕举荐一些不错的 Python 博客 假如是 Python 基础的话,廖雪峰的博客教程会是一个不错的选择:

  Python3 教程  Python 2.7 教程

 因此专门多刚接触 Python 的同学反应廖大大的教程中部分跳跃性太大,假如觉得跳跃性太大能够结合菜鸟教程一起看:

  Python3 教程 | 菜鸟教程  Python 基础教程 | 菜鸟教程

 假如你英文稍好的话举荐依旧看官方文档:Python 3.6.0 documentation 假如不是为了学习 Python 基础的话,举荐几个其他的博客。

  董老师的博客:小明明 s à domicile «Python-Web 开发实战»的作者,

  知乎某位工程师的博客:分类«Python» ,具体是哪位大神我不太清晰。

  依云大大的博客文章值得深读:依云"s Blog  «从 Python 开始学编程»的作者博客:Python - 标签 - Vamei - 博客园 ,然而此博客的内容也是比较偏向基础知识的。

  pythonware 的制造者,Python 图像库〔PIL〕的制造者:effbot.org

  我专...

版权所有:袖书文档网 2002-2024 未经授权禁止复制或建立镜像[袖书文档网]所有资源完全免费共享

Powered by 袖书文档网 © All Rights Reserved.。备案号:鲁ICP备20026461号-1