首页 编程教程正文

【2020年春季人教版教科书】爬RM教育出版社提供的电子教材

piaodoo 编程教程 2020-02-22 22:15:23 1137 0 python教程

本文来源吾爱破解论坛

本帖最后由 twostudy 于 2020-2-13 18:48 编辑
1.问题说明

人民教育出版社为落实疫情防控期间中小学校“停课不停教、不停学”要求,在网上公布了下学期的电子版教材。网址(http://bp.pep.com.cn/jc/)
前段时间我也一直在找相关教材的PDF,奈何质量好的比较少。这是权威发布的版本,质量应该是最好的了,而且涵盖范围广,涵盖小学、初中、高中到中职。
下一本当然不过瘾所以当然要多爬几本了,何况还有教师用书。

QQ浏览器截图20200213182415.png (106.6 KB, 下载次数: 0)

下载附件  保存到相册

2020-2-13 18:24 上传


1.png (57.16 KB, 下载次数: 1)

下载附件  保存到相册

2020-2-13 18:47 上传


2.png (63.1 KB, 下载次数: 1)

下载附件  保存到相册

2020-2-13 18:47 上传


3.png (53.25 KB, 下载次数: 1)

下载附件  保存到相册

2020-2-13 18:47 上传


4.png (56.09 KB, 下载次数: 1)

下载附件  保存到相册

2020-2-13 18:47 上传

请大家轻点爬,就算都爬下来了,等用的时候应该都改版了。 2.Python程序 这里就放一个函数接口,如《小学道德与法治教科书》地址为(http://bp.pep.com.cn/jc/ywjygjkcjc/xdjc/) 只需要(/ywjygjkcjc/xdjc/)就行了
import requests
from tqdm import tqdm
from bs4 import BeautifulSoup
import os

def bookDown(url):
        #  获取当前工作目录
    saveDirectory = os.getcwd()

        #  页面获取与解析
    rootURL ='http://bp.pep.com.cn/jc'+url
    bookHtml = requests.get(rootURL)
    bookHtml.encoding = 'UTF-8'
    htmlsoup = BeautifulSoup(bookHtml.text,'lxml')

        #  创建存放文件夹
    directoryName = htmlsoup.find('h4')
    saveDirectory = saveDirectory+'\\'+str(directoryName.string)
    if not os.path.exists(saveDirectory):
        os.makedirs(saveDirectory)

        #  PDF的文件名和绝对地址
    bookName = htmlsoup.find_all('h6')
    bookSubUrl = htmlsoup.find_all('a', attrs={'class':'btn_type_dl'}, href = True)

        #  下载页面所有PDF教材
    bookNum = len(bookName)
    for index in range(bookNum):
        pdfName = saveDirectory+'\\'+bookName[index].string+'.pdf'
        pdfDownloadUrl = rootURL+bookSubUrl[index]['href'][2:]
        getPdf = requests.get(pdfDownloadUrl)
        content_size = int(int(getPdf.headers['Content-Length'])/1024)
        print(pdfName)
        pdfFile = open(pdfName,'wb')
        for data in tqdm(iterable=getPdf.iter_content(1024),total=content_size,unit='k',desc=pdfName):
            pdfFile.write(data)
        pdfFile.close()
3.感谢 1.第一次发帖,请大家多批评 2. 感谢 home.php?mod=space&uid=965057  ai酸的博文 等大佬和同好,从他们的代码学习了很多。

QQ浏览器截图20200213180543.png (433.8 KB, 下载次数: 0)

下载附件  保存到相册

一年级春季

2020-2-13 18:06 上传

版权声明:

本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。

有关影视版权:本站只供百度云网盘资源,版权均属于影片公司所有,请在下载后24小时删除,切勿用于商业用途。本站所有资源信息均从互联网搜索而来,本站不对显示的内容承担责任,如您认为本站页面信息侵犯了您的权益,请附上版权证明邮件告知【754403226@qq.com】,在收到邮件后72小时内删除。本文链接:https://www.piaodoo.com/7997.html

评论

搜索