当前位置：首页 > news >正文

AI驱动测试自动化：基于Codex与DeepSeek的Selenium/Appium实战指南

news 2026/6/16 20:15:25

1. 项目概述：Codex与测试自动化的新范式

最近在测试圈子里，Codex这个词的热度持续攀升。无论是技术社区还是招聘要求，都频繁出现“AI自动化测试”、“Codex接入”这样的关键词。作为一个在测试领域摸爬滚打了十多年的老手，我最初看到“Codex测试自动化”这个标题时，第一反应是：这又是一个被过度包装的概念吗？但当我深入去了解、并亲自上手实践后，我发现，它确实代表了一种新的工作流和可能性，而不仅仅是简单的工具叠加。

简单来说，“Codex测试自动化”的核心，是利用类似Codex这样的AI代码生成模型，来辅助甚至驱动整个软件测试流程的自动化。它解决的痛点非常明确：传统自动化测试脚本的编写和维护成本高、对测试工程师的编程能力要求苛刻、面对快速迭代的业务需求响应迟缓。Codex这类工具的出现，让我们能够通过自然语言描述测试意图，由AI生成可执行的测试代码，或者智能分析现有代码并自动补充测试用例，从而极大地提升测试效率和质量。

这不仅仅是“用AI写Selenium脚本”那么简单。它涉及到测试策略的重新思考、测试用例设计的智能化、以及测试执行与维护的自动化闭环。无论是Web端的Selenium、App端的Appium，还是接口测试、甚至是硬件相关的串口或仪器控制（如用Python控制频谱仪），Codex都有潜力介入，将测试工程师从重复、繁琐的编码工作中解放出来，更专注于测试场景设计、业务逻辑验证和缺陷深度分析。

这篇文章，我将结合我近期的探索和实践，为你彻底拆解“Codex测试自动化”。我会从核心思路讲起，带你一步步了解如何将其融入现有测试框架，分享实操中的关键配置和避坑经验，并探讨它如何与Selenium、Appium、Pytest等经典工具结合，构建更智能的测试体系。无论你是正在寻找效率突破的测试负责人，还是希望提升个人竞争力的测试工程师，相信都能从中获得可直接落地的参考。

2. 核心思路：当AI成为测试脚本的“结对编程”伙伴

在深入技术细节之前，我们必须先统一思想：引入Codex的目标不是取代测试工程师，而是成为一位不知疲倦、知识渊博的“结对编程”伙伴。它的价值在于放大测试工程师的能力，而不是替代思考。

2.1 从“手工编码”到“意图驱动”的范式转变

传统的自动化测试脚本开发流程是线性的：分析需求 -> 设计测试用例 -> 手动编写脚本 -> 调试脚本 -> 执行并维护。其中，“手动编写脚本”是最大的瓶颈，尤其对于复杂的交互逻辑或动态页面元素。

Codex引入后，流程演变为：分析需求 -> 用自然语言描述测试场景与验证点 -> AI生成脚本草稿 -> 工程师审查、修正与优化 -> 集成执行。变化的核心在于，脚本的“初稿”由AI基于海量代码训练经验快速生成。例如，你只需要描述“登录成功测试：在首页点击登录按钮，输入正确的用户名和密码，点击提交，验证是否跳转到用户中心页面”，Codex就能理解并生成对应的Selenium Python代码框架。

这种转变带来的直接好处是：

降低入门门槛：测试人员可以更专注于业务逻辑和测试设计，而不必纠结于XPath怎么写、显式等待如何设置等语法细节。
提升脚本一致性：AI生成的代码往往遵循常见的编程规范和模式，有助于统一团队代码风格。
加速知识传递：新成员或对某技术栈（如Appium）不熟的工程师，可以通过描述需求快速获得可工作的代码示例，学习曲线变缓。

2.2 Codex在测试生命周期中的关键作用点

Codex的能力可以渗透到测试的多个环节，而不仅仅是脚本生成：

测试用例生成：基于需求文档或产品功能描述，自动生成正向、反向的测试用例描述，甚至直接转化为Gherkin语言（Given-When-Then）的BDD场景。
自动化脚本生成：这是最直接的应用。根据测试用例描述，生成Web（Selenium）、移动端（Appium）、API（Requests库）等不同层面的自动化代码。
测试数据构造：智能生成符合边界条件的测试数据，例如，生成特定格式的邮箱、手机号、超长字符串等。
测试代码审查与优化：对已有的自动化脚本进行分析，指出潜在的脆弱定位器（如绝对XPath）、缺少的异常处理、或建议更佳的实现方式。
错误日志分析与根因推测：当自动化测试失败时，将错误日志和上下文信息喂给Codex，它可以帮忙分析可能的原因，例如“元素未找到可能是因为页面加载延迟，建议增加显式等待”。

注意：必须清醒认识到，当前阶段的Codex并非万能。它生成的代码需要经过严格的审查和调试。它可能无法理解非常复杂的业务上下文，生成的定位器也可能不够健壮。它的角色是“强大的助手”，而测试工程师必须是最终的“决策者和负责人”。

2.3 与现有测试框架的融合策略

你不需要推翻现有的Selenium + Pytest + Allure的成熟框架。Codex应该以“插件”或“辅助工具”的形式嵌入现有流程。例如：

在用例设计阶段：使用Codex将Excel或脑图中的测试点快速转化成Pytest的测试函数模板。
在脚本编写阶段：在IDE中安装Codex插件，在编写find_element时，用注释描述你要找的元素，让AI建议定位器。
在维护阶段：将失败的测试用例和页面HTML片段提供给Codex，让它帮助重构或修复定位器。

关键在于建立一套人机协作的规范：什么任务适合交给AI初稿（如常规的CRUD操作测试），什么任务必须由人工精心设计（如涉及复杂状态机、金融计算的业务场景）。

3. 环境搭建与核心工具链选型

要实现Codex测试自动化，你需要搭建一个包含AI能力和传统测试工具的环境。这里我以最普遍的Python技术栈为例，提供一个稳定可用的方案。

3.1 AI能力接入：选择你的“Codex”

“Codex”本身常特指OpenAI的Codex模型，但由于网络访问等问题，国内直接使用存在困难。因此，我们需要寻找替代方案。目前主要有几种路径：

使用国内可访问的AI大模型API：这是最推荐的方式。例如：
- DeepSeek：性能强劲，对代码生成和理解支持很好，且提供了丰富的API。这也是为什么“codex接入deepseek”成为热词的原因。
- 文心一言、通义千问、智谱GLM：国内大厂出品，稳定性和中文语境理解有优势。
- 接入方式：通常你需要注册相应的云平台开发者账号，获取API Key。然后通过它们的官方Python SDK或直接调用HTTP API来集成。
使用开源代码大模型本地部署：如CodeLlama、StarCoder等。这种方式数据隐私性好，但对本地GPU资源要求高，且模型效果可能略逊于顶级商用API。适合对数据安全有极端要求的企业内网场景。
使用IDE智能插件：如Cursor、Bito、或国内插件的代码补全功能。它们底层也连接了AI模型，可以在编码时直接提供帮助，但通常不适合做批量的、定制化的测试脚本生成。

我的选择与理由：对于大多数测试团队，我建议从DeepSeek的API开始。它的性价比高，代码生成质量可靠，文档齐全，且避免了复杂的本地部署。我们可以将其封装成一个工具类，供整个测试框架调用。

3.2 基础测试框架搭建

AI负责生成“血肉”，坚实的测试框架则是“骨架”。一个典型的自动化测试框架包含以下层级：

层级	可选组件	作用	与AI的结合点
编程语言	Python 3.8+	主流选择，生态丰富	Codex对Python的代码生成支持最为成熟
Web自动化	Selenium 4.x	浏览器自动化	AI生成页面操作、元素定位代码
移动端自动化	Appium 2.x	安卓/iOS应用自动化	AI生成Appium Desired Capabilities配置、手势操作代码
接口自动化	Requests, Pytest	HTTP接口测试	AI生成接口请求构造、断言代码
测试执行与报告	Pytest, Allure	组织用例、生成报告	AI可帮助生成Pytest夹具（fixture）和Allure注解
设备/模拟器	雷电模拟器、真机	移动端测试环境	AI生成的脚本需适配不同设备分辨率

环境搭建步骤简述：

安装Python：从官网安装，建议使用虚拟环境（venv）隔离项目依赖。
安装核心库：在虚拟环境中，执行pip install selenium appium-python-client pytest requests allure-pytest。
安装驱动：
- Web测试：下载与浏览器版本匹配的ChromeDriver或GeckoDriver，并放入系统PATH。
- 移动测试：安装Appium Server（可通过npm安装或下载桌面版），并配置Android SDK或Xcode。
配置模拟器：如使用雷电模拟器，确保其ADB调试端口（如5555）开放，Appium能够连接。

3.3 封装AI工具类

这是连接AI与测试框架的关键。我们将创建一个Python类，用于发送提示词（Prompt）给AI API并获取返回的代码。

# ai_coder.py import openai # 这里以OpenAI格式的SDK为例，DeepSeek等兼容此格式 import json class AICodeGenerator: def __init__(self, api_key, base_url="https://api.deepseek.com/v1", model="deepseek-coder"): # 初始化客户端，base_url和model需根据实际使用的AI平台修改 self.client = openai.OpenAI(api_key=api_key, base_url=base_url) self.model = model def generate_test_code(self, prompt, context=""): """ 根据提示词生成测试代码。 :param prompt: 自然语言描述的测试场景，如“测试登录功能，用户名密码正确应跳转首页” :param context: 可选，上下文信息，如页面URL、已有Page Object类等 :return: 生成的代码字符串 """ system_message = """你是一个资深的测试开发工程师，精通Selenium、Appium和Pytest。请根据用户需求，生成高质量、可维护的Python自动化测试代码。代码应包含必要的导入、清晰的逻辑、健壮的元素定位（优先使用ID、CSS Selector）和明确的断言。使用Pytest作为测试框架。""" user_message = f""" 上下文信息： {context} 测试需求： {prompt} 请直接生成完整的Python测试函数代码，不要包含任何解释性文字。 """ try: response = self.client.chat.completions.create( model=self.model, messages=[ {"role": "system", "content": system_message}, {"role": "user", "content": user_message} ], temperature=0.2, # 温度调低，使输出更确定、更专业 max_tokens=1500 ) generated_code = response.choices[0].message.content # 清理可能出现的代码块标记 if generated_code.startswith("```python"): generated_code = generated_code[10:-3] if generated_code.endswith("```") else generated_code[9:] elif generated_code.startswith("```"): generated_code = generated_code[7:-3] if generated_code.endswith("```") else generated_code[6:] return generated_code.strip() except Exception as e: print(f"调用AI API失败: {e}") return None # 使用示例 if __name__ == "__main__": api_key = "your_deepseek_api_key_here" coder = AICodeGenerator(api_key) test_prompt = "为我们的登录页面编写一个测试。页面URL是'http://example.com/login'。有一个ID为'username'的用户名输入框，一个ID为'password'的密码输入框，和一个ID为'submit'的按钮。登录成功后，页面会跳转到'http://example.com/dashboard'。请测试登录成功的情况。" code = coder.generate_test_code(test_prompt) if code: print("生成的代码：") print(code) # 可以将code保存到.py文件中 # with open('test_login.py', 'w') as f: # f.write(code)

这个工具类是整个自动化的引擎。通过精心设计system_message和user_message，我们可以引导AI生成更符合我们框架规范和偏好的代码。

4. 实战：分场景构建AI驱动的测试脚本

有了环境和工具，我们进入实战环节。我将分Web、App和API三个最常见场景，演示如何与AI协作编写测试脚本。

4.1 Web自动化测试：Selenium与AI的协奏

假设我们要测试一个电商网站的加入购物车功能。

第一步：人工分析与提供上下文首先，作为测试工程师，你需要分析页面，确定关键元素和流程。例如：

商品列表页：商品卡片（CSS选择器：.product-item），“加入购物车”按钮（在商品卡片内）。
购物车图标：ID为cart-icon，点击可查看购物车侧边栏。
侧边栏中购物车商品项：CSS选择器为.cart-item。
验证点：加入后，购物车图标上的数字应增加，侧边栏应出现对应商品。

第二步：构造给AI的提示词将你的分析转化为清晰、结构化的提示词，并提供必要的上下文（如基础Page Object结构）。

context = """ 我们使用Page Object模式。已有基础页面类BasePage，包含driver和通用方法。 现在需要测试商品加入购物车功能。 """ prompt = """ 请生成一个Pytest测试函数，测试电商网站商品加入购物车功能。 步骤： 1. 打开商品列表页（假设URL在BasePage中已配置）。 2. 定位第一个商品卡片（.product-item）。 3. 在该商品卡片内，点击“加入购物车”按钮（文本是“加入购物车”）。 4. 点击页面右上角的购物车图标（ID是cart-icon），打开购物车侧边栏。 5. 验证购物车图标上的数字徽章（一个<span>元素）文本从'0'变为'1'。 6. 验证购物车侧边栏中（.cart-item）的商品数量为1。 请使用显式等待确保元素可交互。使用assert进行断言。 函数名请用 test_add_to_cart。 """

第三步：执行生成并审查代码运行ai_coder.generate_test_code(prompt, context)，你会得到类似下面的代码：

import pytest from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC class TestShoppingCart: def test_add_to_cart(self, driver): # 假设driver通过pytest fixture提供 wait = WebDriverWait(driver, 10) # 1. 打开商品列表页 (假设基础URL已在driver中设置) driver.get("/products") # 2. 定位第一个商品卡片并点击加入购物车 first_product = wait.until(EC.presence_of_element_located((By.CSS_SELECTOR, ".product-item"))) add_to_cart_btn = first_product.find_element(By.XPATH, ".//button[contains(text(), '加入购物车')]") add_to_cart_btn.click() # 3. 验证购物车徽章数字更新 cart_badge = wait.until(EC.text_to_be_present_in_element((By.CSS_SELECTOR, "#cart-icon span"), "1")) # 上面这行代码有误，text_to_be_present_in_element返回的是条件，不是元素。应修改为： # wait.until(EC.text_to_be_present_in_element((By.CSS_SELECTOR, "#cart-icon span"), "1")) # cart_badge = driver.find_element(By.CSS_SELECTOR, "#cart-icon span") # assert cart_badge.text == "1" # 4. 点击购物车图标 cart_icon = driver.find_element(By.ID, "cart-icon") cart_icon.click() # 5. 验证购物车侧边栏中的商品数量 cart_items = wait.until(EC.visibility_of_all_elements_located((By.CSS_SELECTOR, ".cart-item"))) assert len(cart_items) == 1, f"期望购物车有1个商品，实际有{len(cart_items)}个"

第四步：人工审查与修正AI生成的代码是一个优秀的起点，但你必须审查。上面代码中我已经发现了一个错误：text_to_be_present_in_element的使用方式不对。此外，还需要检查：

定位器是否健壮：AI可能使用了脆弱的XPath，需要优化为更稳定的ID或CSS选择器。
等待策略是否合理：是否在正确的操作后设置了足够的等待。
断言是否全面：是否覆盖了所有关键的验证点。
是否符合团队规范：比如变量命名、异常处理等。

修正后的代码才是可用的。这个过程体现了“人机协作”：AI负责产出大量模板代码，工程师负责质量把关和业务逻辑校准。

4.2 移动端自动化测试：驾驭Appium与模拟器

移动端测试的复杂性在于设备碎片化和环境配置。AI可以帮助我们快速生成针对不同场景的Appium脚本。

场景：测试一个新闻App的登录功能（使用雷电模拟器运行安卓App）。

提示词构造：

prompt = """ 请生成一个Appium测试脚本，用于测试安卓新闻App的登录功能。 已知信息： - 使用雷电模拟器，设备名是emulator-5554。 - App的包名是com.example.news，主Activity是.MainActivity。 - 登录界面：用户名输入框的resource-id是‘com.example.news:id/et_username’，密码输入框的resource-id是‘com.example.news:id/et_password’，登录按钮的resource-id是‘com.example.news:id/btn_login’。 - 登录成功后，会跳转到主页面，主页面上有一个ID为‘com.example.news:id/tv_welcome’的TextView，其文本会包含用户名。 请编写一个Pytest测试函数，使用正确的Appium Desired Capabilities配置，测试使用有效用户名‘testuser’和密码‘123456’登录是否成功。请包含必要的导入和配置。 """

AI可能生成的Desired Capabilities配置和测试代码框架：

from appium import webdriver from appium.options.android import UiAutomator2Options import pytest @pytest.fixture(scope="function") def appium_driver(): options = UiAutomator2Options() options.platform_name = 'Android' options.device_name = 'emulator-5554' # 或从环境变量读取 options.automation_name = 'UiAutomator2' options.app_package = 'com.example.news' options.app_activity = '.MainActivity' # options.no_reset = True # 是否重置App状态 driver = webdriver.Remote('http://localhost:4723', options=options) yield driver driver.quit() def test_login_success(appium_driver): driver = appium_driver # 等待登录界面元素出现 from appium.webdriver.common.appiumby import AppiumBy from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC wait = WebDriverWait(driver, 20) # 输入用户名 username_field = wait.until(EC.presence_of_element_located((AppiumBy.ID, 'com.example.news:id/et_username'))) username_field.send_keys('testuser') # 输入密码 password_field = driver.find_element(AppiumBy.ID, 'com.example.news:id/et_password') password_field.send_keys('123456') # 点击登录 login_btn = driver.find_element(AppiumBy.ID, 'com.example.news:id/btn_login') login_btn.click() # 验证登录成功 welcome_text = wait.until(EC.presence_of_element_located((AppiumBy.ID, 'com.example.news:id/tv_welcome'))) assert 'testuser' in welcome_text.text

关键审查点：

Capabilities配置：检查device_name、app_package/activity是否正确。automation_name必须为UiAutomator2（安卓）。
定位方式：移动端优先使用ID（即resource-id），其次是ACCESSIBILITY_ID（content-desc），XPath是最后的选择且效率较低。
等待时间：移动端交互可能更慢，等待时间（如20秒）需要合理设置。
设备连接：确保appium server已启动，并且雷电模拟器已通过ADB连接（adb devices可查看）。

AI帮助我们快速搭建了脚本骨架，但具体的包名、Activity名、元素ID等，仍然需要测试工程师通过Appium Inspector或UI Automator Viewer等工具事先获取。这是AI无法替代的实地勘察工作。

4.3 API自动化测试：让AI理解业务逻辑

API测试的核心是构造请求、发送请求、验证响应。AI在理解业务逻辑并生成相应的测试数据和断言方面很有帮助。

场景：测试一个用户注册接口。

提示词：

prompt = """ 请生成一个Pytest测试函数，测试用户注册REST API。 接口信息： - 端点：POST /api/v1/register - 请求头：Content-Type: application/json - 请求体JSON示例：{"username": "string", "email": "string", "password": "string"} - 成功响应：HTTP 201， JSON体：{"code": 0, "message": "success", "data": {"userId": 123}} - 失败响应（用户名已存在）：HTTP 400， JSON体：{"code": 1001, "message": "username already exists"} 请编写两个测试用例： 1. 测试注册成功，使用随机的用户名和邮箱（邮箱需符合格式）。 2. 测试注册失败（用户名重复），使用一个已存在的用户名。 请使用requests库和pytest。包含必要的导入和清晰的断言。 """

AI生成的代码可能包含：

import pytest import requests import random import string BASE_URL = "http://your-api-server.com" def generate_random_string(length=8): letters = string.ascii_lowercase return ''.join(random.choice(letters) for i in range(length)) def generate_random_email(): return f"{generate_random_string()}@example.com" class TestUserRegistration: def test_register_success(self): url = f"{BASE_URL}/api/v1/register" headers = {"Content-Type": "application/json"} # 生成随机测试数据 username = f"test_user_{generate_random_string(6)}" email = generate_random_email() password = "Test@123456" payload = { "username": username, "email": email, "password": password } response = requests.post(url, json=payload, headers=headers) assert response.status_code == 201 response_json = response.json() assert response_json["code"] == 0 assert response_json["message"] == "success" assert "userId" in response_json["data"] assert isinstance(response_json["data"]["userId"], int) def test_register_fail_duplicate_username(self): url = f"{BASE_URL}/api/v1/register" headers = {"Content-Type": "application/json"} # 使用一个已知存在的用户名 existing_username = "existing_user" payload = { "username": existing_username, "email": generate_random_email(), "password": "Test@123456" } response = requests.post(url, json=payload, headers=headers) assert response.status_code == 400 response_json = response.json() assert response_json["code"] == 1001 assert "already exists" in response_json["message"].lower()

这份代码已经相当完整，涵盖了正向和反向用例，生成了随机测试数据，并进行了多层断言。测试工程师需要做的是：

替换BASE_URL为实际地址。
审查随机数据生成逻辑是否符合业务规则（如密码复杂度）。
可能需要处理接口依赖，比如清理测试数据（teardown）。
考虑将公共部分（如URL、headers）抽取为fixture或常量。

5. 集成与优化：打造智能测试工作流

生成单个脚本只是第一步。要让AI测试自动化真正产生价值，必须将其集成到持续集成/持续部署（CI/CD）流水线中，并建立优化反馈机制。

5.1 在CI/CD流水线中嵌入AI脚本生成

我们不可能在每次流水线运行时都动态生成新脚本。合理的做法是，将AI脚本生成作为流水线的一个独立、可触发的环节，例如在以下场景触发：

新功能分支创建时：根据需求描述或接口定义文档，自动生成基础测试脚本框架，提交到对应测试目录。
页面结构发生重大变更后：通过对比工具发现DOM结构变化，触发AI重新生成或更新受影响脚本的定位器部分。
定期（如每周）优化任务：对失败率高的测试用例，让AI分析日志并尝试生成修复建议。

一个简单的集成思路：

在GitLab CI/CD或Jenkins中创建一个generate-tests的job。
该job读取特定格式的需求描述文件（如Markdown文件）。
调用封装好的AICodeGenerator工具类，生成测试脚本。
通过代码质量工具（如black,flake8）对生成的代码进行格式化。
将生成的脚本提交到一个待审核的目录或创建Merge Request，由测试工程师审查后合并。

5.2 建立Prompt知识库与模板

AI生成代码的质量，极大程度上依赖于Prompt（提示词）的质量。为了提高效率和一致性，团队应该建立和维护一个Prompt知识库。

Prompt模板示例：

生成Page Object类：“请为一个名为LoginPage的Page Object类生成Python代码，使用Selenium。页面包含以下元素：ID为username的用户名输入框，ID为password的密码输入框，类名为btn-submit的提交按钮。请包含open()、login(username, password)和get_error_message()方法。”
修复脆弱的定位器：“以下Selenium定位器//div[@id='container']/div[3]/button[2]非常脆弱。请根据下面提供的HTML片段，为我提供一个更健壮的替代方案（优先使用ID或CSS选择器）。HTML片段：<div id='container'><button id='cancel'>Cancel</button><button id='submit'>Submit</button></div>”
生成数据驱动测试参数：“我需要测试一个计算器软件的加法功能。请为@pytest.mark.parametrize装饰器生成5组测试参数，包括正数、负数、零、小数和大数。参数格式为(a, b, expected_sum)。”

将常用的Prompt模板化、参数化，可以显著降低使用门槛，并保证团队输出代码风格的一致性。

5.3 效果评估与持续优化

引入AI后，需要建立度量指标来评估其效果：

脚本生成成功率：AI生成的脚本，经过简单修正后能直接运行成功的比例。
代码审查通过率：AI生成的脚本，在团队代码审查中一次性通过的比例。
效率提升比：对比纯手工编写，使用AI辅助后，编写相同复杂度脚本所需时间的减少比例。
脚本稳定性：AI生成的脚本与人工编写的脚本，在长期运行中的失败率对比。

根据这些指标，持续优化你的Prompt、调整AI模型参数（如temperature）、以及完善上下文信息的提供方式。例如，如果发现AI生成的定位器经常失败，就在系统指令（system_message）中更加强调“使用唯一且稳定的ID或CSS选择器，避免使用索引XPath”。

6. 避坑指南与常见问题排查

在实际操作中，我踩过不少坑。这里总结几个最关键的问题和解决方案，希望能帮你少走弯路。

6.1 AI生成代码的常见缺陷及修正

问题类型	AI可能生成的代码示例	问题分析	修正建议
脆弱的元素定位	`driver.find_element(By.XPATH, “/html/body/div[1]/div[2]/button”)`	使用绝对路径XPath，页面结构微调就会失败。	优先使用ID、name、或相对稳定的CSS选择器。如`By.ID(“submit-btn”)`或`By.CSS_SELECTOR(“.primary-btn”)`。
缺少等待机制	`element = driver.find_element(...); element.click()`	网络或渲染延迟可能导致元素尚未出现或不可交互，引发`NoSuchElementException`或`ElementNotInteractableException`。	使用显式等待`WebDriverWait`配合`EC`（expected_conditions）。`wait.until(EC.element_to_be_clickable((By.ID, “myBtn”))).click()`
断言不充分	`assert “success” in driver.page_source`	检查页面源码中的字符串过于宽泛，可能误判。	定位到具体的成功提示元素，获取其文本进行精确断言。`assert success_message.text == “操作成功”`
硬编码测试数据	`username = “admin”`	多次运行会导致数据冲突（如用户已存在）。	使用随机或唯一的测试数据。`username = f”test_user_{random.randint(10000,99999)}”`
资源未清理	测试函数中直接创建driver，未`quit()`。	导致浏览器或App进程残留，耗尽系统资源。	使用Pytest的fixture来管理driver的生命周期，在`yield`后执行`driver.quit()`。

6.2 环境与配置问题

AI API调用失败或超时：
- 检查网络：确保你的服务器或本地机器能稳定访问所选AI服务的API端点。
- 检查配额与账单：确认API Key有效且未超出调用频率或额度限制。
- 调整超时设置：在请求AI API时，适当增加超时时间，特别是生成长代码时。
生成的代码语法或导入错误：
- 模型幻觉：AI有时会“捏造”不存在的库或方法。仔细检查导入语句和函数调用。
- 版本不匹配：AI训练的代码可能基于较新或较旧的库版本。检查你本地安装的Selenium、Appium-Python-Client等库的版本，确保API兼容。在Prompt中明确指定版本号会有帮助，如“请使用Selenium 4.x的语法”。
移动端测试连接失败：
- Appium Server未启动：运行appium -p 4723确保服务在运行。
- 设备未连接：执行adb devices确认模拟器或真机已列出。
- Capabilities错误：仔细检查appPackage,appActivity,deviceName,platformVersion等是否与目标设备/应用匹配。使用Appium Inspector可以直观地获取这些信息。

6.3 关于“Codex设置中文不生效”等问题的思考

网络热词中提到了“codex设置中文不生效”。这通常指的是在IDE插件或某些AI工具界面中，希望将交互语言设置为中文但未成功。对于我们通过API集成的方式，这个问题本质是如何让AI更好地理解中文需求并生成代码。

解决方案：

系统指令（System Message）中明确语言：在调用API时，在system_message中明确指出“请使用中文进行思考和交流，但最终输出的代码必须是Python/Java等编程语言。”
选择对中文支持好的模型：像DeepSeek、文心一言等国内模型，对中文提示词的理解天生就比国外模型更精准。
提示词本身要清晰、无歧义：即使使用中文，也要像写技术需求一样，描述清楚元素特征（如“ID为‘登录按钮’的元素”），而不是模糊的“点击那个登录的按钮”。

6.4 成本与效率的平衡

使用商业AI API会产生费用。为了控制成本并提升效率：

批量生成：将多个相关的测试场景合并到一个Prompt中请求，比分开请求多个小Prompt更划算。
缓存结果：对于通用的、不变的测试模式（如基础的CRUD操作），生成的代码可以保存为模板，无需每次都调用AI。
本地模型兜底：对于简单的代码补全或修正，可以配置IDE的本地代码补全插件。仅在需要复杂逻辑生成或深度分析时调用付费API。

最后，我想分享一点个人体会：Codex测试自动化不是银弹，它不会让一个不懂测试的人瞬间变成专家。它的最大价值，是让专业的测试工程师如虎添翼，从重复劳动中解脱，去处理更复杂、更需要人类智慧和经验的测试设计、探索性测试和质量分析工作。拥抱它，但始终保持审慎和主导权，让AI成为你手中最得力的工具，而不是反过来被工具所驾驭。开始尝试时，可以从一个小而具体的场景入手，比如用AI为某个新增的API接口生成测试脚本，逐步积累经验和信心，再扩展到更复杂的UI自动化场景。

查看全文

http://www.rkmt.cn/news/1537246.html