惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
Webroot Blog
Webroot Blog
U
Unit 42
A
About on SuperTechFans
宝玉的分享
宝玉的分享
月光博客
月光博客
C
CERT Recently Published Vulnerability Notes
P
Privacy International News Feed
Microsoft Security Blog
Microsoft Security Blog
G
Google Developers Blog
P
Privacy & Cybersecurity Law Blog
cs.CL updates on arXiv.org
cs.CL updates on arXiv.org
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
S
Securelist
CTFtime.org: upcoming CTF events
CTFtime.org: upcoming CTF events
Spread Privacy
Spread Privacy
L
Lohrmann on Cybersecurity
Apple Machine Learning Research
Apple Machine Learning Research
K
Kaspersky official blog
Hugging Face - Blog
Hugging Face - Blog
B
Blog
I
Intezer
Last Week in AI
Last Week in AI
T
Threat Research - Cisco Blogs
V
V2EX
L
LangChain Blog
AI
AI
G
GRAHAM CLULEY
T
Tor Project blog
人人都是产品经理
人人都是产品经理
D
Docker
WordPress大学
WordPress大学
Google DeepMind News
Google DeepMind News
I
InfoQ
Y
Y Combinator Blog
C
Comments on: Blog
GbyAI
GbyAI
www.infosecurity-magazine.com
www.infosecurity-magazine.com
酷 壳 – CoolShell
酷 壳 – CoolShell
T
Tailwind CSS Blog
aimingoo的专栏
aimingoo的专栏
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
腾讯CDC
N
News and Events Feed by Topic
MyScale Blog
MyScale Blog
H
Help Net Security
Vercel News
Vercel News
T
Tenable Blog
博客园 - 三生石上(FineUI控件)
爱范儿
爱范儿

老董笔记

尚硅谷机构在哪?尚硅谷培训怎么样?靠谱吗-互联网IT百科 韩顺平介绍,传智讲师,开办泰牛,入尚硅谷等一系列-互联网IT百科 pandas多重索引标准样式(写入excel有空行)-互联网IT百科 cannot join with no overlapping index names-互联网IT百科 pandas多列变多行(即宽表变长表)melt和stack函数-互联网IT百科 pandas多行转多列(长表变宽表)pivot和unstack-互联网IT百科 Index contains duplicate entries, cannot reshape完美解决-互联网IT百科 single positional indexer is out-of-bounds-互联网IT百科 Can only compare identically-labeled Series objects-互联网IT百科 pandas transform用法详解(多个案例)-互联网IT百科 python四舍五入精确实现-互联网IT百科 pandas的groupby使用apply分组排序-互联网IT百科 index 0 is out of bounds for axis 0 with size 0-互联网IT百科 pandas分组过滤filter函数-互联网IT百科 联想Win10系统如何禁用触摸屏关闭触摸-互联网IT百科 groupby分组计算transform转换返回相同长度序列-互联网IT百科 brooks seo教程python教程,brooks seo教程网盘,布鲁seo资源-互联网IT百科 电脑右键文件夹一直转圈电卡死怎么回事-互联网IT百科 施琪嘉的心理成长课(荐)-互联网IT百科 百度SEO公司_SEO推广公司哪家好_SEO外包服务如何选-老董笔记 groupby后agg同1列用多个聚合函数、不同列用不同函数、自定义函数-互联网IT百科 pandas的groupby单列多列分组聚合运算-互联网IT百科 DataFrameGroupBy对象及分组个数、分组大小、组名索引、组数据详解-互联网IT百科 pandas中groupby之Grouper and axis must be same length-互联网IT百科 pandas中groupby的分组原理-互联网IT百科 pandas的groupby的使用详解大全-互联网IT百科 openpyxl单元格自动换行强制换行Alignment(wrapText=True)-互联网IT百科 python教程全套(可就业)-互联网IT百科 联想win10系统CPU显示100%,电脑呼呼响怎么回事-互联网IT百科 如何自制CPU,CPU原理是怎么样的?-互联网IT百科 多款视频制作工具(免费)分享及素材推荐-互联网IT百科 pandas坑:创建df后多行数据重复-互联网IT百科 pandas坑:非空字典创建df后为空df-互联网IT百科 3种方法创建字节串bytes及其使用-互联网IT百科 yield是什么?为什么可以暂停程序,让出CPU-互联网IT百科 python自定义异常实现(BaseException与Exception差别)-互联网IT百科 基于生成器实现上下文管理器(contextmanager装饰器)-互联网IT百科 什么是上下文管理器,基于类自定义上下文管理器-互联网IT百科 cookie与session是什么?有何关系-互联网IT百科 requests使用http代理(含auth认证代理)、socks代理-互联网IT百科 requests的SSL证书验证及警告处理-互联网IT百科 requests自动登录的2种方法(session对象与cookie)-互联网IT百科 requests会话对象Session跨请求保持cookie-互联网IT百科 requests上传多个文件及表单信息-互联网IT百科 requests上传单个文件-互联网IT百科 requests之post字符串、json数据及含中文字符处理-互联网IT百科 requests的post请求提交表单的2种方式-互联网IT百科 封装requests自定义请求函数限制最大请求次数-互联网IT百科 requests的r.raw流式下载与r.content的区别-互联网IT百科 什么是前端和后端,前后端开发的区别-互联网IT百科 requests二进制响应r.content下载图片视频及解码gzip和deflate-互联网IT百科 客户端、终端、服务端是什么意思-互联网IT百科 文本文件和二进制的区别(人和动物的区别)-互联网IT百科 什么是同步异步,同步异步的区别-互联网IT百科 python枚举项比较运算及相同的key和value的处理-互联网IT百科 python枚举类Enum应用场景及枚举类获取标签和值-互联网IT百科 python抽象类的定义和实现(abc模块)-互联网IT百科 类的约束子类继承父类与鸭子类型-互联网IT百科 openpyxl add_image指定单元格插入图片设置图片大小-互联网IT百科 openpyxl unmerge_cells取消合并单元格指定单元格坐标指定行列位置-互联网IT百科 openpyxl合并单元格指定行列位置,指定起始单元格-互联网IT百科 seo教程_seo视频教程_冯耀宗seo|附子seo-互联网IT百科 pip 安装 Could not install packages due to an OSError: [WinError 5] 拒绝访问。: 'D:\\-互联网IT百科 DataFrame的[],loc,iloc多条件判断筛选(布尔索引的本质)-互联网IT百科 DataFrame的iloc位置索引,切片,布尔索引筛选单多行多列-互联网IT百科 DataFrame的loc标签,切片,布尔索引选择单行多行多列-互联网IT百科 DataFrame直接索引,切片,布尔索引选择单行多行-互联网IT百科 selenium不重启更改代理ip(使用隧道代理)-互联网IT百科 什么是多态,统一函数接口实现多态-互联网IT百科 单下划线变量和方法-单前导下划线-互联网IT百科 java面试 :​​​​​​​servlet的配置文件 web.xml-互联网IT百科 Java面试 :如何解决servlet线程安全-互联网IT百科 Java面试 :servlet的生命周期及servlet常用方法-互联网IT百科 Java面试 :类的加载机制是什么?-互联网IT百科 面试: Redis集群方案哪些方案?-互联网IT百科 面试:Redis适合在哪些场景使用-互联网IT百科 面试:Redis所有数据放到内存中的原因是什么?-互联网IT百科 面试:Redis有哪几种数据淘汰策略?-互联网IT百科 面试:Redis相比memcached有哪些优势?-互联网IT百科 面试:Redis是什么?-互联网IT百科 前端面试题演示jQuery的链式调用过程-互联网IT百科 前端面试题演示一下jQuery扩展插件-互联网IT百科 Java IO和NIO的区别是什么-互联网IT百科 从浏览器地址栏输入URL到显示页面的过程-互联网IT百科 类外部如何访问私有属性私有方法-互联网IT百科 seo快排浏览器指纹(基本指纹|高级指纹|硬件指纹|协议栈指纹)-互联网IT百科 Reindexing only valid with uniquely valued Index objects-互联网IT百科 pandas空dataframe对象添加列cannot set a frame with no defined index and a scalar-互联网IT百科 selenium谷歌浏览器崩溃out of memory彻底解决-互联网IT百科 pycharm破解(2022年亲测)pycharm激活码完美2099年-互联网IT百科 pycharm破解到2099年-互联网IT百科 抖音美食短视频创造者学员必备剪辑视频基础课-老董笔记 陈小叔《落地实践班:抖音流量引流+抖音变现》-老董笔记 自媒体高效创作工具大全课 最好用的自媒体工具大全-老董笔记 shopee狼群团队:shopee虾皮全套课程(附相关文件)无水印版-老董笔记 12节影评变现课,教你写出好玩|涨粉|又赚钱的影评-老董笔记 精品课程:新手玩拼多多从0到高手赚钱全攻略【完结】-老董笔记 百微商学院:微博SEO实战引流玩法 快速实现被动获客-老董笔记 微商百度霸屏玩法和短视频批量引流玩法(课件+录音)-老董笔记 selenium消除启动特征避免被反爬-互联网IT百科
selenium贴吧批量发帖(多账号多吧)-互联网IT百科
2020-11-13 · via 老董笔记

  一堆账号一对吧,挨个发帖累趴下,不宜手动需要脚本。selenium多账号对贴吧发帖脚本如下:

  注意

  1、发帖按钮用的js提交,如果发布过程出现输入验证码,会提示发布成功但实际上未发布上去。

  功能:多账号多吧多条内容,每个账号在每个吧发第一条内容,第二条内容。默认发帖间隔60-70秒

  用法:

  1、要准备cookie_zh.txt, 一行一个cookie

  2、准备一个test文件夹,里面放一堆txt文件,每个txt文件是一个帖子(帖子标题是文件名,内容是文件内容)

  3、准备好tiebas.txt,一行一个要发的贴吧网址(https://tieba.baidu.com/f?kw=百度&ie=utf-8)

# -*- coding: utf-8 -*-
"""
注意:
用的js提交,如果发布过程出现输入验证码,会提示发布成功但实际上未发布上去)
说明:
多账号多吧多条内容
每个账号在每个吧第一条内容,第二条内容...
默认发帖间隔60-70秒
用法:
准备cookie_zh.txt 一行一个cookie
准备test文件夹,一个txt文件是一个帖子(帖子标题是文件名,内容是文件内容)utf-8编码
准备tiebas.txt,一行一个要发的贴吧网址
"""

import time
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.chrome.options import Options
import random
from selenium.webdriver.common.action_chains import ActionChains
import os


def get_driver(chromedriver_path,chrome_path,ua):
    ua = ua
    option = Options()
    option.binary_location = chrome_path
    option.add_argument("user-agent=" + ua)
    option.add_argument("--no-sandbox")
    option.add_argument("--disable-dev-shm-usage")
    option.add_argument("--disable-gpu")
    option.add_argument("--disable-features=NetworkService")
    option.add_argument("--disable-features=VizDisplayCompositor")
    # option.add_argument('headless')
    option.add_argument('log-level=3')  # 屏蔽日志
    option.add_argument('--ignore-certificate-errors-spki-list')  # 屏蔽ssl error
    option.add_argument('-ignore -ssl-errors')  # 屏蔽ssl error
    option.add_experimental_option("excludeSwitches", ["enable-automation"])
    option.add_experimental_option('useAutomationExtension', False)
    No_Image_loading = {"profile.managed_default_content_settings.images": 1}
    option.add_experimental_option("prefs", No_Image_loading)
    # 屏蔽webdriver特征
    option.add_argument("--disable-blink-features")
    option.add_argument("--disable-blink-features=AutomationControlled")
    driver = webdriver.Chrome(options=option, chrome_options=option,executable_path=chromedriver_path)
    return driver


def get_files(filepath):
    paths = []
    files = os.listdir(filepath)
    for file in files:
        path = filepath + file
        paths.append(path)
    return paths

# 获得所有账号cookie
def get_cookie(filepath):
    cookie_list = []
    cookie_list = [line.strip() for line in open(filepath,'r',encoding='utf-8')]
    return cookie_list


# 字符串cookie转为字典
def to_dict(cookie_str):
    cookie = {}
    lists = cookie_str.split(';')
    for i in lists:
        j = i.strip()
        j = j.split('=')
        cookie[j[0]] = j[1]
    return cookie


# 获得所有贴吧
def get_tiebas(filepath):
    tieba_list = [line.strip() for line in open(filepath,'r',encoding='utf-8')]
    return tieba_list


# 自动登录
def auto_login(cookie_dict):
    num = user_name = 0
    teiba_index = 'https://tieba.baidu.com/'
    driver.get(teiba_index)
    driver.delete_all_cookies()
    for k, v in cookie_dict.items():
        driver.add_cookie({'name': k, 'value': v})
    try:
        driver.get(teiba_index)  # 带cookie访问
        # 右侧导航加载
        navs = WebDriverWait(driver, 30).until(
            EC.visibility_of_element_located((By.ID, "com_userbar"))
        )
        li_list = driver.find_elements_by_css_selector('#com_userbar > ul >li')
        li_classnames = [li.get_attribute('class') for li in li_list]
        if 'u_username' in li_classnames:
            num = 1
            user = WebDriverWait(driver, 30).until(
                EC.visibility_of_element_located(
                    (By.CSS_SELECTOR, "#j_u_username > div.u_menu_item.u_menu_username > a > span"))
            )
            user_name = user.text
    except Exception as e:
        print('登陆过程异常',e)
    else:
        pass
    finally:
        return num,user_name


# 发帖
def fa_tie(title,content,url):
    num = 0
    try:
        # 打开贴吧
        driver.get(url)
        # 加载关注按钮
        guanzhu = WebDriverWait(driver, 30).until(
            EC.visibility_of_element_located((By.ID, "j_head_focus_btn"))
        )
        # 加载签到按钮
        qiandao = WebDriverWait(driver, 20).until(
            EC.visibility_of_element_located((By.XPATH, '//*[@id="signstar_wrapper"]/a'))
        )
        # 标题部分加载
        input_title = WebDriverWait(driver, 20).until(
            EC.visibility_of_element_located((By.XPATH, '//*[@id="tb_rich_poster"]/div[3]/div[1]/div[2]/input'))
        )
        # 内容部分加载
        input_content = WebDriverWait(driver, 30).until(
            EC.visibility_of_element_located((By.ID, "ueditor_replace"))
        )
        # 鼠标移动到关注和签到按钮
        ActionChains(driver).move_to_element(guanzhu).perform()
        ActionChains(driver).move_to_element(qiandao).perform()
        # 作者列表
        posts_author = driver.find_elements_by_class_name('frs-author-name-wrap')
        # 帖子列表
        posts = driver.find_elements_by_class_name('j_th_tit')
        if len(posts_author) > 0 and len(posts) > 0:
            # 随机选几个作者
            authors_rand = random.sample(posts_author,3) if len(posts_author) > 2 else posts_author
            # 鼠标随机移动
            for author in authors_rand:
                ActionChains(driver).move_to_element(author).perform()
                time.sleep(random.randint(1,3))

            # 随机选几个帖子
            posts_rand = random.sample(posts, 3) if len(posts) > 2 else posts
            # 鼠标随机移动
            for post in posts_rand:
                ActionChains(driver).move_to_element(post).perform()
                time.sleep(random.randint(1, 3))
        # 滚动条到底部
        driver.execute_script(js)

        time.sleep(2)
        ActionChains(driver).move_to_element(input_title).click().perform()
        time.sleep(1)
        # js赋值帖子标题
        title_js = 'document.querySelector("#tb_rich_poster > div.poster_body.editor_wrapper > div.poster_component.title_container > div.j_title_wrap > input").value ="{0}"'.format(title)
        driver.execute_script(title_js)

        # 鼠标点击进贴吧内容框
        js_content_position = "document.getElementById('ueditor_replace').click();"
        driver.execute_script(js_content_position)
        # ActionChains(driver).move_to_element(input_content).click().perform()
        time.sleep(0.5)
        # 输入帖子内容
        for wd in content:
            time.sleep(0.04)
            input_content.send_keys(wd)
        time.sleep(random.random())
        
        # 用js方式提交 出现弹窗不会影响提交
        button_js = 'document.querySelector("#tb_rich_poster > div.poster_body.editor_wrapper > div.poster_component.editor_bottom_panel.clearfix > div > button.btn_default.btn_middle.j_submit.poster_submit").click()'
        driver.execute_script(button_js)
        num = 1
    except Exception as e:
        print(e,'发帖异常..')
    finally:
        return num


def main(tiebas,my_files,cookie_list,time1,time2):
    for cookie in cookie_list:
        try:
            cookie_dict = to_dict(cookie)
            num_auto,user_name = auto_login(cookie_dict) # 自动登录
            if num_auto == 1:
                print(user_name,'自动登录成功')
                # exit()
            else:
                print('自动登录失败')
                continue
        except Exception as e:
            print(e, '未顺利登录')
        else:
            # for my_file in my_files:
            for i in range(2):
                my_file = random.choice(my_files)
                filepath, fullflname = os.path.split(my_file)
                my_title, ext = os.path.splitext(fullflname)
                my_content = ''.join(open(my_file,'r',encoding='utf-8').readlines())
                # my_content = '‌​‌⁢http://tiebapic.baidu.com/forum/w%3D580/sign=73b03dc8ce33c895a67e9873e1127397/55c959899e510fb373b03dc8ce33c895d0430ccc.jpg董某人发扬鸠摩智精神 修炼贴吧武学 贴吧英雄大会有幸会齐北乔峰南慕容,一开始宣称没我鸠摩智算什么英雄大会,认为北乔峰就闭而不战,南慕容简直浪得虚名。被虐后感叹降龙十八掌果然天下第一!,\n' + my_content
                my_img = 'http://tiebapic.baidu.com/forum/w%3D580/sign=73b03dc8ce33c895a67e9873e1127397/55c959899e510fb373b03dc8ce33c895d0430ccc.jpg'
                for tieba in tiebas:
                    num = fa_tie(my_title,my_content,tieba)
                    if num == 1:
                        print(tieba,my_file,'--发布成功')
                    else:
                        print(tieba,my_file,'--发布失败')
                    time.sleep(random.randint(time1,time2))
        finally:
                time.sleep(random.randint(time1,time2))
                driver.delete_all_cookies()


if __name__ == "__main__":
    f = open('tieba_fabu_fail.txt','a',encoding='utf-8')
    js = 'window.scrollBy(0,{0})'.format('document.body.scrollHeight')

    chromedriver_path = 'D:/python3/install/chromedriver.exe'
    chrome_path = 'C:/Program Files (x86)/Google/Chrome/Application/chrome.exe'
    ua = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.125 Safari/537.36'
    # 全局变量
    driver = get_driver(chromedriver_path,chrome_path,ua)
    # cookie账号路径
    cookie_path = './cookie_zh.txt'
    cookie_list = get_cookie(cookie_path)
    my_files = get_files('./test/')
    tiebas = get_tiebas('./tiebas.txt')
    # 登陆间隔时间最小and最大
    sleep_min, sleep_max = 60, 70
    main(tiebas,my_files,cookie_list,sleep_min,sleep_max)
    driver.quit()

很赞哦!

python编程网提示:转载请注明来源www.python66.com。
有宝贵意见可添加站长微信(底部),获取技术资料请到公众号(底部)。同行交流请加群 python学习会