当前位置：首页 > news >正文

Python 实测｜这家免费企业数据 API 连反爬都没有，数据质量却意外能打

news 2026/6/16 17:00:14

摘要：在企业级应用开发中，工商、司法等数据的实时查询与核验是常见需求。本文将实测鲸海数据的企业数据API，重点评估其免费额度、接口易用性和数据质量，并通过一个 Python 经营异常检测的代码案例，验证其使用场景。

正文：

近期在准备开发一个 CRM 系统项目，有个需求对数据要求比较高：在录入客户信息时，需要根据用户输入的公司名称，自动补全其统一社会信用代码、注册地址、法人等信息，并对存量客户进行经营风险的初步筛查。

手动去公开网站查询效率太低且难以自动化。所以，我们考虑集成API，直接调用相关的数据。在对市面上几家主流服务商进行调研后，我们的选型标准主要集中在以下几点：

接入成本：是否提供足够的免费额度，以便在开发和测试阶段进行充分验证。
数据维度：能否覆盖基础工商信息、股东、司法风险等核心维度。
API易用性：是否为标准的 RESTful 风格，文档是否清晰，对接起来是否方便。
数据质量：数据更新是否及时，准确率如何。

最后，我们选了鲸海数据的企业信息API。最核心的原因在于它直接提供了 1000 次的免费调用额度，并且权限开放，甚至网址本身就可以直接爬数据……这对于我们进行 PoC (Proof of Concept) 验证来说非常友好。

下面分享实测体验，供有需要的朋友参考。

1.API注册与试用额度获取

注册链接在这里：

鲸海数据– 企业数据接口服务商 | 工商/风险/招投标/司法大数据-鲸海API

首页就有很明显的注册入口，注册流程比较标准，手机号验证即可。

和其他的服务商一样，鲸海数据领取额度要做实名验证，上传企业和个人信息。不过这家的审核很宽松，随便填都能秒过。

完成认证后，就能在后台看到1000次的免费额度已经到账了，API调用凭证、剩余总量都在一个界面，方便查看。

系统里还有简单的数据统计，可以查看已经用了哪些API、接口分布和相应耗时变化。

2.接口权限与数据质量

有些服务商的免费额度权限是阉割版的，用起来哪哪都是限制。这家比较厚道，给的1000次额度并非针对单一接口，而是全平台的所有API通用。

从他们的API数据市场来看，从基础的工商照面，到深度的司法诉讼、知识产权、招投标信息等，加起来有上百个细分维度。

对于一个新项目来说，这个覆盖面加上1千次的试用额度，足以支撑完成核心业务逻辑的开发与测试了。

还有个很友好的点，是每个接口支持在线调试，展示对应的参数输入框，开发者只需按提示填写即可快速验证数据结构、字段完整性和参数逻辑。

我随机测了几组数据，并跟几个大厂的付费数据交叉比对了下，数据准确度、及时性都很ok，可以放心用。

3.API文档与在线调试

每个接口点进去看详情，整体介绍都比较清晰。提供了完整的请求地址、参数说明、请求示例和 JSON 返回示例。接口遵循 RESTful 设计规范，使用 GET 请求和标准的 HTTP Header 进行鉴权，对于熟悉 HTTP 协议的开发者来说，几乎没有学习压力。

4.网站居然还能直接爬数据

除了API，他们官网可以直接查数据，搜公司、产品或法人名字都可以拿去搜。

然后，我就发现了一个bug：网站防御做得相当佛系，搜出来的数据可以直接爬。

我简单测了一下，几乎没遇到什么反爬限制，基础的工商字段敞开供你抓取。如果你只是需要一些基础的企业底座数据做清洗或画像分析，直接上爬虫即可。

这种bug一般都有时效性，保不齐哪天羊毛就被薅秃了，建议大家哪怕现在手头没项目，也先去占个位。

5.这类企业数据API可以做什么？（Python代码示例）

我用“经营异常信息”的接口，做了个自动查询指定企业是否存在经营异常记录的功能，自动返回企业经营异常信息，包含列入日期、列入经营异常名录原因、移出日期等。做出来完全跑得通。

大概思路如下：

import requests import urllib.parse # --- 1. 配置你的认证信息 --- # 在鲸海数据官网注册后，从后台获取 APP_ID = "YOUR_APP_ID" # 替换成你的 App Id API_KEY = "YOUR_API_KEY" # 替换成你的 Api Key BASE_URL = "https://www.kqdaas.com" def check_operation_anomaly(company_name): """ 查询指定公司的经营异常信息并打印结果。 """ print(f"\n===== 正在查询「{company_name}」的经营异常信息... =====") # --- 2. 准备请求参数 --- # 根据API文档，企业名称需要作为路径参数，并且要进行URL编码 encoded_company_name = urllib.parse.quote(company_name) # 构造请求URL和查询参数 # queryType=1 表示我们是按企业名称来查询 url = f"{BASE_URL}/DataService/api/v3/company/operationExcept/{encoded_company_name}" params = { "queryType": 1, "pageIndex": 1, "pageSize": 10 # 查询前10条异常记录 } headers = { "X-Jinghai-App-Id": APP_ID, "X-Jinghai-Api-Key": API_KEY, "Accept": "application/json" } # --- 3. 发起请求并处理返回结果 --- try: response = requests.get(url, headers=headers, params=params, timeout=15) if response.status_code == 200: result = response.json() # 业务状态码为200，表示查询成功 if result.get("errcode") == 200: data = result.get("data", {}) anomaly_list = data.get("list", []) if anomaly_list: print(f"�� 风险预警：发现 {len(anomaly_list)} 条经营异常记录！") print("-" * 40) for i, item in enumerate(anomaly_list, 1): print(f"【异常记录 {i}】") print(f" 列入原因: {item.get('putReason', '未知')}") print(f" 列入日期: {item.get('putDate', '未知')}") # 判断是否已移出，如果移出日期为空，则显示"暂未移出" remove_date = item.get('removeDate') print(f" 移出日期: {remove_date if remove_date else '暂未移出'}") print("-" * 20) else: print("✅ 该企业经营状态正常，暂无经营异常记录。") else: # 处理业务层面的错误，如公司未找到、API Key错误等 print(f"查询失败: {result.get('errmsg')}") else: # 处理网络层面的错误 print(f"请求失败，HTTP状态码: {response.status_code}, 错误信息: {response.text}") except requests.exceptions.RequestException as e: print(f"网络请求异常: {e}")

这个比较适合金融信贷、平台招商做准入审核时，排除有经营风险的企业，有需要的还可以增加司法诉讼、失信记录等维度的排查。

另外，对于有下面这些业务需求的公司或朋友，这个API也是刚需。