培训平台

向皇冠体育在线添加新平台

平台指南

  • 培训新平台
  • 增强现有平台
  • 检测不同的Captchas
  • 修改搜索范围
  • 多步骤表格
  • 更改成功/失败足迹

Notepad ini

自2011年以来,皇冠体育在线已经具备了学习新平台的能力,皇冠体育在线几乎可以发布到任何不需要在站点网站上创建用户帐户的平台或表单。所以它可以发布到博客平台,留言簿,联系表格,引用,一些开放论坛和维基。

要使用平台,您需要使用Microsoft .ini创建一个纯文本文件的定义文件 格式 像上面的截图。这包含[Sections],其中包含许多Name = value键。 皇冠体育在线平台文件的第一部分是......

[建立]

设置决定了收集器中使用什么足迹来找到平台的基础知识,皇冠体育在线在加载页面后如何识别该平台,皇冠体育在线如何检测对该平台的评论是成功还是失败以及如何处理URL和导航页面。以下是可用于设置的可用Name =条目。

的FriendlyName = 您要调用平台的任何名称都将在GUI中使用。
UseBlackList = 值可以是1表示使用黑名单,0表示不使用黑名单。这是您可以在海报中编辑的错误单词列表。
UseWhiteList = 值可以是1表示使用白名单,0表示不使用白名单。这是您可以在海报中编辑的错误单词列表。
平台= 这是它的平台类型,例如Blog,GuestBook,Image,Forum,Contact Form,Trackback,用于对类似平台进行分组。
标记= 如何处理链接和代码,值可以是HTML或BB
PageMustContain = 如果在页面代码中找到任何给定的字符串,则该页面有效。 |被解释为OR,*被解释为AND
成功= 如果在发布后可以在结果页面中找到任何给定的字符串,则提交成功。 |被解释为OR,*被解释为AND
失败= 如果在发布后可以在结果页面中找到任何给定的字符串,则提交失败。 |被解释为OR,*被解释为AND

所有平台定义文件都应添加和设置上述字段,它们本质上是形成平台平台文件[建立]的最小“必需”字段。下面的字段不是必需的,但通常必须用于执行更高级的功能才能发布到某些平台。

PageMustNotContain = 如果在页面代码中找到任何给定的字符串,则该页面无效。 |被解释为OR,*被解释为AND
ENCTYPE = 如果您希望覆盖表单默认编码,例如application / x-www-form-urlencoded,则为Encoding类型
使用loadURL = 找到给定的URL并加载目标页面。将跳过RemovefromUrl,RemoveFromUrlAfter和ModifyUrl
LoadUrlFromAnchor = 找到给定的锚点,抓取URL并加载目标页面。将跳过RemovefromUrl,RemoveFromUrlAfter和ModifyUrl
RemoveFromUrl = 从baseurl中删除给定的字符串。多个字符串用|分隔
RemoveFromUrlAfter = 从baseurl中给定字符串的位置删除所有内容。多个字符串用|分隔
ModifyUrl = 添加一些东西到baseurl。变量%host%和%path%可用于重建baseurl。
DeleteCookies = 要删除的cookie名称列表

留言板示例

Bella Guestbook这里 您可以看到Bella Guestbook的[设置]的基本示例。

对于PageMustContain,PageMustNotContain,Success和Failed值,它会扫描页面内容以查找您添加的标记,以便在页面内容中添加text,html,javascript或任何内容。

该平台还使用2个可选值RemoveFromUrl和ModifyUrl。这告诉皇冠体育在线何时登陆留言簿,无论页面应该修剪index.php和sign.php以及这些之后的所有内容,如URL中的查询字符串,然后加载%host %% path%sign.php,如果它落地在scrapebox.com/guestbook/index.php?page=123上它将删除最后一部分并加载scrapebox.com/guestbook/sign.php

当您发布评论所需的页面与您加载的页面不同时,将使用此选项。因此,您可以训练皇冠体育在线导航到正确的页面来发布帖子。

创建[设置]后,接下来是处理发布的[步骤]。以下是步骤部分的可用选项和变量。

DoStepIf = 仅当在页面代码中找到任何给定字符串时才处理此步骤。 |被解释为OR,*被解释为AND。如果未设置,将始终处理该步骤。
FormMustContain = 当在表单中找到任何给定的字符串时,表单有效。 |被解释为OR,*被解释为AND
FormMustNotContain = 如果表单包含任何给定的字符串,则表单无效。 |被解释为OR,*被解释为AND
PostUrl = A |用于抓取帖子网址的url部分的分隔列表。它介于两者之间


AddToPostUrl = 邮寄地址添加的值。可以使用掩码(%...%)。
DelayPost = 延迟发布给定的秒数。变量%rndnum-x-y%也可以使用。
DelayPostIf = 只有在找到任何列出的字符串时才延迟发布。多个字符串用|分隔
AddToPostDataIfInpage = 将任何带|的时候添加所有AddToPostData =字段在页面代码中可以找到分隔的字符串。
AddToPostData = 当AddToPostdataIfInPage条件为true时,fieldname = variable将添加到postdata。如果未设置AddToPostDataIfInpage,则始终添加AddToPostData。
EncodeFieldNames = 1将url编码字段名。

字段名可以包含*作为通配符。因此,如果fieldname是captcha_code123,其中123在每个博客/帖子上是不同的,那么captcha_code * =%captcha%将匹配。

变量:
使用变量的所有ini设置允许spintax,例如thename = {%rnd-name%|%rnd-email%}有效。分配给变量的值也允许spintax。
%主办% 表示目标URL的主机名
%路径% 表示目标URL的路径
%RND名称% 从文件~cpn.txt返回一个随机名称。 Spintax允许。
%RND电子邮件% 从文件~cpe.txt返回一个随机电子邮件,允许Spintax。
%RND-网站% 从文件~cpw.txt返回一个随机网站,允许Spintax。
%RND注释% 返回文件中的随机注释~cpc.txt允许Spintax。
%RND选项% 返回一个随机选项。从中抓取价值观 %RND-位置% Spintax允许。
%rndnum-X-Y% 返回x和y之间的随机数。
%忽视% 只需使用表单中表示的原始值即可。
%用户域% 提取先前由%rnd-website%生成的用户网站的域名
%用户名% 以前由%rnd-name%生成的用户名
%用户的电子邮件% 以前由%rnd-email%生成的电子邮件
%用户评论% 以前由%rnd-comment%生成评论
%的用户位置% 以前由%rnd-location%生成的位置
%用户的网站% 以前由%rnd-website%生成的网站
%wphashcash% WPHashCash处理的结果(内部代码)
验证码%% 图像验证码结果
%题% 文本验证码结果
%serverstatus-200% 表示服务器状态代码200
%serverstatus-302% 表示服务器状态代码302
%标题-XXXX% 检查帖子标题中是否存在xxxx。
%unixtimestamp% 返回当前的unix时间戳
%unixtimestampms% 以毫秒为单位返回当前的unix时间戳
%XXXXXX% 执行名称为xxxxx的部分

您可以为多步骤表单配置多个[步骤],可能需要您填写2页或更多页面上的信息。

评论海报教程

查看我们的视频教程,其中显示了评论海报。此功能包含在皇冠体育在线中,并且与我们的Automator插件兼容。

我们为皇冠体育在线提供了数百个视频教程。

查看YouTube频道