念念不忘
必有回响

采集各种美女图片站并下载图片、自动搭建并发布,打造属于自己的图片网站

说明:距离上次给男同学们分享爬虫福利已经有一年多了,福利就自己在博客翻下,现在再分享个大佬的爬虫项目,可以爬取mm131、mmjpg、妹子图等各大美女图片站,然后下载图片后,自动帮你发布并搭建一个属于你自己的图片站,该项目作者也在长期维护,貌似正在对接OneDrive,还是很不错的,如果营养快线多的可以自己搭建个慢慢欣赏吧。

前台效果图

采集各种美女图片站并下载图片、自动搭建并发布,打造属于自己的图片网站

说明

项目地址: https://git.coding.net/zxy_coding/94imm.git

环境要求:Python 3.6、Mysql 5.5+、Nginx/Apache(非必需),本文只说CentOS 6/7、Debian 8/9。

这里使用宝塔和手动2种方法安装,如果你需要快速上手就使用手动安装,想操作方便就宝塔,自行选择。

安装环境

1、使用宝塔安装

安装完成后,进入面板,点击左侧软件管理,然后安装Mysql 5.5+、Nginx(如果你使用域名的话,就需要安装)。

然后点击左侧数据库-添加数据库,设置好数据库信息。

2、手动安装环境

这里博主是用的Mysql 5.7,如果内存很低,5.7跑起来会有点吃力,建议增加点虚拟内存,可以用下Swap一键脚本→传送门。

安装Mysql 5.7:

这里CentOS安装MySQL 5.7的时候会生成一个随机密码,使用命令查看:

grep "password" /var/log/mysqld.log

#大致信息,******为密码

[Note] A temporary password is generated for root@localhost: ******

然后CentOS还需要修改数据库密码:

创建新的数据库,使用命令:

此时Mysql 5.7算是安装完成了。

安装Caddy:

搭建站点
1、安装Python3
为了避免下面依赖安装出错,这里就不使用软件包安装Python3了,直接就使用脚本安装,使用命令:

2、搭建站点

填上你的数据库信息,大致如下:

再使用Ctrl+x、y保存退出。

编辑启动配置文件,使用命令:

然后看着改,大致修改如下:

启动程序:

uwsgi --ini uwsgi.ini

此时站点地址为ip:8000。

3、域名反代

宝塔面板设置:
然后点击左侧网站-添加站点,填上你的域名,其他默认,然后点击域名设置-反向代理,url设置 http://127.0.0.1:8000即可。然后打开你的域名就可以看到站点了。

Caddy设置:

采集发布

光搭建站点是不够的,还需要采集并自动发布图片,爬虫和发布脚本在crawler目录,详细脚本说明:

这里以mm131爬虫脚本为例,先编辑crawler_mm131.py爬虫脚本。

大致修改如下:

然后开始采集并自动发布到程序,使用命令:

然后就可以再图片站看到你的图片了,要是不显示的话,可以尝试删除cache目录里的缓存文件。

如果你的硬盘空间很小,可以使用压缩脚本压缩下,使用命令:

如果压缩报错No module named 'PIL',那需要先使用命令pip3 install Pillow。

如果你要发布你本地的图片,就需要编辑AutoPost.py,填上你的数据库信息,再使用python3 AutoPost.py发布即可。

最后你运行爬虫脚本的时候出现UnicodeEncodeError: 'ascii' codec can't encode错误,那就需要先将系统的默认语言环境编码设置为UTF-8格式,使用命令:

其他说明

对于修改模板,目前模板总共有3套,位于templates文件夹下,需要先修改silumz下settings文件中的模板配置。

然后将模板目录下的pagination.html文件放入python安装目录的pagination下。

一般为/usr/local/lib/python3.6/site-packages/dj_pagination/templates/pagination

然后自己修改模板,模板为html文件,可在页面添加统计代码和广告代码。

对于想了解更多的,或者修改模板,爬虫分类、数据库的可以看下以下参考文章:

原文转载地址:https://www.moerats.com/archives/827/    感兴趣的可以试着搭建。

赞(0) 打赏
未经允许不得转载:小蚁上树 » 采集各种美女图片站并下载图片、自动搭建并发布,打造属于自己的图片网站
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址