初期操作

​打开有道翻译界面—f12—network—在翻译框中输入’hello’—在network下面发现名为’translate_o?smartresult……’返回翻译之后的数据

分析参数

把所有的request headers、params都写上尝试爬虫,可以得到结果。

​然后request headers中headers、host、origin、referer三项留下,cookie一项经尝试只有 outfox_search_user_id=-1927650476@223.97.13.65;会验证而且尝试多次之后我这里是没有变化的。

accept: application/json, text/javascript, */*; q=0.01
accept-encoding: gzip, deflate
accept-language: zh-cn,zh;q=0.9
connection: keep-alive
content-length: 252
content-type: application/x-www-form-urlencoded; charset=utf-8
cookie: outfox_search_user_id=-1927650476@223.97.13.65; outfox_search_user_id_ncoo=1897197670.972445; jsessionid=aaalvpunk-sv2fyr-ujex; ___rl__test__cookies=1612924426799
host: fanyi.youdao.com
origin: http://fanyi.youdao.com
referer: http://fanyi.youdao.com/
user-agent: mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/88.0.4324.150 safari/537.36
x-requested-with: xmlhttprequest

再就是params参数,变化的是salt、sign、lts,尝试后发现lts可有可无,所以变化的只有salt、sign两项。

i: 你好
from: auto
to: auto
smartresult: dict
client: fanyideskweb
salt: 16129244361391
sign: 2820759b6e54f25e0aa94e185e2265e3
lts: 1612924436139
bv: 3da01a09873456cfb5dba05f2124b148
doctype: json
version: 2.1
keyfrom: fanyi.web
action: fy_by_realtlme

分析salt、sign

全局搜索sign,结果中有fanyi.min.js文件,双击进入,然后右键选择’open in source panel’,搜索’sign’,找到如下代码:

define("newweb/common/service", ["./utils", "./md5", "./jquery-1.7"], function(e, t) {
 var n = e("./jquery-1.7");
 e("./utils");
 e("./md5");
 var r = function(e) {
  var t = n.md5(navigator.appversion)
   , r = "" + (new date).gettime()
   , i = r + parseint(10 * math.random(), 10);
  return {
   ts: r,
   bv: t,
   salt: i,
   sign: n.md5("fanyideskweb" + e + i + "tbh5e8=q6u3exe+&l[4c@")
  }
 };

​可以看出salt是13位时间戳加了一个10以内的随机数,而sign是’固定字符串+e+i+固定字符串’,其中i就是salt,而e经过断点调试(我选择在var t = n.md5(navigator.appversion)这一行加断点,然后输入你好,会出现e=’你好’)可以得知e为我们要翻译的字符串。这样整个分析过程就结束了。

​之后通过爬虫可以得到我们想要的数据,因为返回的是json数据,我们使用.json()来获得返回值更加方便。

python代码

import hashlib
import random
import time
import requests


def get_data():
 r = str(round(time.time() * 1000))
 salt = r + str(random.randint(0, 9))

 content = '你好'

 data = "fanyideskweb" + content + salt + "tbh5e8=q6u3exe+&l[4c@"
 sign = hashlib.md5()

 sign.update(data.encode("utf-8"))

 sign = sign.hexdigest()
 # print(len(sign))
 # print(sign)
 return content, salt, sign


def send_request(content, salt, sign):
 url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'

 headers = {
  'cookie': 'outfox_search_user_id=-1927650476@223.97.13.65;',
  'host': 'fanyi.youdao.com',
  'origin': 'http://fanyi.youdao.com',
  'referer': 'http://fanyi.youdao.com/',
  'user-agent': 'mozilla/5.0 (windows nt 10.0; win64; x64) applewebkit/537.36 (khtml, like gecko) chrome/88.0.4324.146 safari/537.36',
 }

 data = {
  'i': str(content),
  'from': 'auto',
  'to': 'auto',
  'smartresult': 'dict',
  'client': 'fanyideskweb',
  'salt': str(salt),
  'sign': str(sign),
  # 'lts': '1612879546052',
  # 'bv': '6a1ac4a5cc37a3de2c535a36eda9e149',
  # 'doctype': 'json',
  'version': '2.1',
  'keyfrom': 'fanyi.web',
  'action': 'fy_by_realtlme',
 }

 res = requests.post(url=url, headers=headers, data=data).json()

 print('翻译后:', res['translateresult'][0][0]['tgt'])
 print('翻译前:', res['translateresult'][0][0]['src'])


if __name__ == '__main__':
 content, salt, sign = get_data()
 send_request(content, salt, sign)

运行效果

以上就是python 实现有道翻译的详细内容,更多关于python 有道翻译的资料请关注www.887551.com其它相关文章!