Coverage for pydantic_ai_slim/pydantic_ai/models/test.py: 99.21%

1from __future__ import annotations as _annotations (empty)

3import re (empty)

4import string (empty)

5from collections.abc import AsyncIterator, Iterable (empty)

6from contextlib import asynccontextmanager (empty)

7from dataclasses import InitVar, dataclass, field (empty)

8from datetime import date, datetime, timedelta (empty)

9from typing import Any, Literal (empty)

11import pydantic_core (empty)

13from .. import _utils (empty)

14from ..messages import ( (empty)

15 ModelMessage,

16 ModelRequest,

17 ModelResponse,

18 ModelResponsePart,

19 ModelResponseStreamEvent,

20 RetryPromptPart,

21 TextPart,

22 ToolCallPart,

23 ToolReturnPart,

24)

25from ..result import Usage (empty)

26from ..settings import ModelSettings (empty)

27from ..tools import ToolDefinition (empty)

28from . import ( (empty)

29 AgentModel,

30 Model,

31 StreamedResponse,

32)

33from .function import _estimate_string_tokens, _estimate_usage # pyright: ignore[reportPrivateUsage] (empty)

36@dataclass (empty)

37class _TextResult: (empty)

38 """A private wrapper class to tag a result that came from the custom_result_text field."""

40 value: str | None (empty)

43@dataclass (empty)

44class _FunctionToolResult: (empty)

45 """A wrapper class to tag a result that came from the custom_result_args field."""

47 value: Any | None (empty)

50@dataclass (empty)

51class TestModel(Model): (empty)

52 """A model specifically for testing purposes.

54 This will (by default) call all tools in the agent, then return a tool response if possible,

55 otherwise a plain response.

57 How useful this model is will vary significantly.

59 Apart from `__init__` derived by the `dataclass` decorator, all methods are private or match those

60 of the base class.

61 """

63 # NOTE: Avoid test discovery by pytest.

64 __test__ = False (empty)

66 call_tools: list[str] | Literal['all'] = 'all' (empty)

67 """List of tools to call. If `'all'`, all tools will be called.""" (empty)

68 custom_result_text: str | None = None (empty)

69 """If set, this text is returned as the final result.""" (empty)

70 custom_result_args: Any | None = None (empty)

71 """If set, these args will be passed to the result tool.""" (empty)

72 seed: int = 0 (empty)

73 """Seed for generating random data.""" (empty)

74 agent_model_function_tools: list[ToolDefinition] | None = field(default=None, init=False) (empty)

75 """Definition of function tools passed to the model. (empty)

77 This is set when the model is called, so will reflect the function tools from the last step of the last run.

78 """

79 agent_model_allow_text_result: bool | None = field(default=None, init=False) (empty)

80 """Whether plain text responses from the model are allowed. (empty)

82 This is set when the model is called, so will reflect the value from the last step of the last run.

83 """

84 agent_model_result_tools: list[ToolDefinition] | None = field(default=None, init=False) (empty)

85 """Definition of result tools passed to the model. (empty)

87 This is set when the model is called, so will reflect the result tools from the last step of the last run.

88 """

90 async def agent_model( (empty)

91 self,

92 *,

93 function_tools: list[ToolDefinition],

94 allow_text_result: bool,

95 result_tools: list[ToolDefinition],

96 ) -> AgentModel:

97 self.agent_model_function_tools = function_tools (empty)

98 self.agent_model_allow_text_result = allow_text_result (empty)

99 self.agent_model_result_tools = result_tools (empty)

100

101 if self.call_tools == 'all': (empty)

102 tool_calls = [(r.name, r) for r in function_tools] (empty)

103 else:

104 function_tools_lookup = {t.name: t for t in function_tools} (empty)

105 tools_to_call = (function_tools_lookup[name] for name in self.call_tools) (empty)

106 tool_calls = [(r.name, r) for r in tools_to_call] (empty)

107

108 if self.custom_result_text is not None: (empty)

109 assert allow_text_result, 'Plain response not allowed, but `custom_result_text` is set.' (empty)

110 assert self.custom_result_args is None, 'Cannot set both `custom_result_text` and `custom_result_args`.' (empty)

111 result: _TextResult | _FunctionToolResult = _TextResult(self.custom_result_text) (empty)

112 elif self.custom_result_args is not None: (empty)

113 assert result_tools is not None, 'No result tools provided, but `custom_result_args` is set.' (empty)

114 result_tool = result_tools[0] (empty)

115

116 if k := result_tool.outer_typed_dict_key: (empty)

117 result = _FunctionToolResult({k: self.custom_result_args}) (empty)

118 else:

119 result = _FunctionToolResult(self.custom_result_args) (empty)

120 elif allow_text_result: (empty)

121 result = _TextResult(None) (empty)

122 elif result_tools: 122 ↛ 125line 122 didn't jump to line 125 because the condition on line 122 was always true(empty)

123 result = _FunctionToolResult(None) (empty)

124 else:

125 result = _TextResult(None)

126

127 return TestAgentModel(tool_calls, result, result_tools, self.seed) (empty)

128

129 def name(self) -> str: (empty)

130 return 'test-model' (empty)

131

132

133@dataclass (empty)

134class TestAgentModel(AgentModel): (empty)

135 """Implementation of `AgentModel` for testing purposes."""

136

137 # NOTE: Avoid test discovery by pytest.

138 __test__ = False (empty)

139

140 tool_calls: list[tuple[str, ToolDefinition]] (empty)

141 # left means the text is plain text; right means it's a function call

142 result: _TextResult | _FunctionToolResult (empty)

143 result_tools: list[ToolDefinition] (empty)

144 seed: int (empty)

145 model_name: str = 'test' (empty)

146

147 async def request( (empty)

148 self, messages: list[ModelMessage], model_settings: ModelSettings | None

149 ) -> tuple[ModelResponse, Usage]:

150 model_response = self._request(messages, model_settings) (empty)

151 usage = _estimate_usage([*messages, model_response]) (empty)

152 return model_response, usage (empty)

153

154 @asynccontextmanager (empty)

155 async def request_stream( (empty)

156 self, messages: list[ModelMessage], model_settings: ModelSettings | None

157 ) -> AsyncIterator[StreamedResponse]:

158 model_response = self._request(messages, model_settings) (empty)

159 yield TestStreamedResponse(_model_name=self.model_name, _structured_response=model_response, _messages=messages) (empty)

160

161 def gen_tool_args(self, tool_def: ToolDefinition) -> Any: (empty)

162 return _JsonSchemaTestData(tool_def.parameters_json_schema, self.seed).generate() (empty)

163

164 def _request(self, messages: list[ModelMessage], model_settings: ModelSettings | None) -> ModelResponse: (empty)

165 # if there are tools, the first thing we want to do is call all of them

166 if self.tool_calls and not any(isinstance(m, ModelResponse) for m in messages): (empty)

167 return ModelResponse( (empty)

168 parts=[ToolCallPart(name, self.gen_tool_args(args)) for name, args in self.tool_calls],

169 model_name=self.model_name,

170 )

171

172 if messages: 172 ↛ 202line 172 didn't jump to line 202 because the condition on line 172 was always true(empty)

173 last_message = messages[-1] (empty)

174 assert isinstance(last_message, ModelRequest), 'Expected last message to be a `ModelRequest`.' (empty)

175

176 # check if there are any retry prompts, if so retry them

177 new_retry_names = {p.tool_name for p in last_message.parts if isinstance(p, RetryPromptPart)} (empty)

178 if new_retry_names: (empty)

179 # Handle retries for both function tools and result tools

180 # Check function tools first

181 retry_parts: list[ModelResponsePart] = [ (empty)

182 ToolCallPart(name, self.gen_tool_args(args))

183 for name, args in self.tool_calls

184 if name in new_retry_names

185 ]

186 # Check result tools

187 if self.result_tools: (empty)

188 retry_parts.extend( (empty)

189 [

190 ToolCallPart(

191 tool.name,

192 self.result.value

193 if isinstance(self.result, _FunctionToolResult) and self.result.value is not None

194 else self.gen_tool_args(tool),

195 )

196 for tool in self.result_tools

197 if tool.name in new_retry_names

198 ]

199 )

200 return ModelResponse(parts=retry_parts, model_name=self.model_name) (empty)

201

202 if isinstance(self.result, _TextResult): (empty)

203 if (response_text := self.result.value) is None: (empty)

204 # build up details of tool responses

205 output: dict[str, Any] = {} (empty)

206 for message in messages: (empty)

207 if isinstance(message, ModelRequest): (empty)

208 for part in message.parts: (empty)

209 if isinstance(part, ToolReturnPart): (empty)

210 output[part.tool_name] = part.content (empty)

211 if output: (empty)

212 return ModelResponse( (empty)

213 parts=[TextPart(pydantic_core.to_json(output).decode())], model_name=self.model_name

214 )

215 else:

216 return ModelResponse(parts=[TextPart('success (no tool calls)')], model_name=self.model_name) (empty)

217 else:

218 return ModelResponse(parts=[TextPart(response_text)], model_name=self.model_name) (empty)

219 else:

220 assert self.result_tools, 'No result tools provided' (empty)

221 custom_result_args = self.result.value (empty)

222 result_tool = self.result_tools[self.seed % len(self.result_tools)] (empty)

223 if custom_result_args is not None: (empty)

224 return ModelResponse( (empty)

225 parts=[ToolCallPart(result_tool.name, custom_result_args)], model_name=self.model_name

226 )

227 else:

228 response_args = self.gen_tool_args(result_tool) (empty)

229 return ModelResponse(parts=[ToolCallPart(result_tool.name, response_args)], model_name=self.model_name) (empty)

230

231

232@dataclass (empty)

233class TestStreamedResponse(StreamedResponse): (empty)

234 """A structured response that streams test data."""

235

236 _structured_response: ModelResponse (empty)

237 _messages: InitVar[Iterable[ModelMessage]] (empty)

238

239 _timestamp: datetime = field(default_factory=_utils.now_utc, init=False) (empty)

240

241 def __post_init__(self, _messages: Iterable[ModelMessage]): (empty)

242 self._usage = _estimate_usage(_messages) (empty)

243

244 async def _get_event_iterator(self) -> AsyncIterator[ModelResponseStreamEvent]: (empty)

245 for i, part in enumerate(self._structured_response.parts): (empty)

246 if isinstance(part, TextPart): (empty)

247 text = part.content (empty)

248 *words, last_word = text.split(' ') (empty)

249 words = [f'{word} ' for word in words] (empty)

250 words.append(last_word) (empty)

251 if len(words) == 1 and len(text) > 2: (empty)

252 mid = len(text) // 2 (empty)

253 words = [text[:mid], text[mid:]] (empty)

254 self._usage += _get_string_usage('') (empty)

255 yield self._parts_manager.handle_text_delta(vendor_part_id=i, content='') (empty)

256 for word in words: (empty)

257 self._usage += _get_string_usage(word) (empty)

258 yield self._parts_manager.handle_text_delta(vendor_part_id=i, content=word) (empty)

259 else:

260 yield self._parts_manager.handle_tool_call_part( (empty)

261 vendor_part_id=i, tool_name=part.tool_name, args=part.args, tool_call_id=part.tool_call_id

262 )

263

264 def timestamp(self) -> datetime: (empty)

265 return self._timestamp (empty)

266

267

268_chars = string.ascii_letters + string.digits + string.punctuation (empty)

269

270

271class _JsonSchemaTestData: (empty)

272 """Generate data that matches a JSON schema.

273

274 This tries to generate the minimal viable data for the schema.

275 """

276

277 def __init__(self, schema: _utils.ObjectJsonSchema, seed: int = 0): (empty)

278 self.schema = schema (empty)

279 self.defs = schema.get('$defs', {}) (empty)

280 self.seed = seed (empty)

281

282 def generate(self) -> Any: (empty)

283 """Generate data for the JSON schema."""

284 return self._gen_any(self.schema) (empty)

285

286 def _gen_any(self, schema: dict[str, Any]) -> Any: (empty)

287 """Generate data for any JSON Schema."""

288 if const := schema.get('const'): (empty)

289 return const (empty)

290 elif enum := schema.get('enum'): (empty)

291 return enum[self.seed % len(enum)] (empty)

292 elif examples := schema.get('examples'): (empty)

293 return examples[self.seed % len(examples)] (empty)

294 elif ref := schema.get('$ref'): (empty)

295 key = re.sub(r'^#/\$defs/', '', ref) (empty)

296 js_def = self.defs[key] (empty)

297 return self._gen_any(js_def) (empty)

298 elif any_of := schema.get('anyOf'): (empty)

299 return self._gen_any(any_of[self.seed % len(any_of)]) (empty)

300

301 type_ = schema.get('type') (empty)

302 if type_ is None: (empty)

303 # if there's no type or ref, we can't generate anything

304 return self._char() (empty)

305 elif type_ == 'object': (empty)

306 return self._object_gen(schema) (empty)

307 elif type_ == 'string': (empty)

308 return self._str_gen(schema) (empty)

309 elif type_ == 'integer': (empty)

310 return self._int_gen(schema) (empty)

311 elif type_ == 'number': (empty)

312 return float(self._int_gen(schema)) (empty)

313 elif type_ == 'boolean': (empty)

314 return self._bool_gen() (empty)

315 elif type_ == 'array': (empty)

316 return self._array_gen(schema) (empty)

317 elif type_ == 'null': (empty)

318 return None (empty)

319 else:

320 raise NotImplementedError(f'Unknown type: {type_}, please submit a PR to extend JsonSchemaTestData!')

321

322 def _object_gen(self, schema: dict[str, Any]) -> dict[str, Any]: (empty)

323 """Generate data for a JSON Schema object."""

324 required = set(schema.get('required', [])) (empty)

325

326 data: dict[str, Any] = {} (empty)

327 if properties := schema.get('properties'): (empty)

328 for key, value in properties.items(): (empty)

329 if key in required: (empty)

330 data[key] = self._gen_any(value) (empty)

331

332 if addition_props := schema.get('additionalProperties'): (empty)

333 add_prop_key = 'additionalProperty' (empty)

334 while add_prop_key in data: (empty)

335 add_prop_key += '_' (empty)

336 if addition_props is True: (empty)

337 data[add_prop_key] = self._char() (empty)

338 else:

339 data[add_prop_key] = self._gen_any(addition_props) (empty)

340

341 return data (empty)

342

343 def _str_gen(self, schema: dict[str, Any]) -> str: (empty)

344 """Generate a string from a JSON Schema string."""

345 min_len = schema.get('minLength') (empty)

346 if min_len is not None: (empty)

347 return self._char() * min_len (empty)

348

349 if schema.get('maxLength') == 0: (empty)

350 return '' (empty)

351

352 if fmt := schema.get('format'): (empty)

353 if fmt == 'date': (empty)

354 return (date(2024, 1, 1) + timedelta(days=self.seed)).isoformat() (empty)

355

356 return self._char() (empty)

357

358 def _int_gen(self, schema: dict[str, Any]) -> int: (empty)

359 """Generate an integer from a JSON Schema integer."""

360 maximum = schema.get('maximum') (empty)

361 if maximum is None: (empty)

362 exc_max = schema.get('exclusiveMaximum') (empty)

363 if exc_max is not None: (empty)

364 maximum = exc_max - 1 (empty)

365

366 minimum = schema.get('minimum') (empty)

367 if minimum is None: (empty)

368 exc_min = schema.get('exclusiveMinimum') (empty)

369 if exc_min is not None: (empty)

370 minimum = exc_min + 1 (empty)

371

372 if minimum is not None and maximum is not None: (empty)

373 return minimum + self.seed % (maximum - minimum) (empty)

374 elif minimum is not None: (empty)

375 return minimum + self.seed (empty)

376 elif maximum is not None: (empty)

377 return maximum - self.seed (empty)

378 else:

379 return self.seed (empty)

380

381 def _bool_gen(self) -> bool: (empty)

382 """Generate a boolean from a JSON Schema boolean."""

383 return bool(self.seed % 2) (empty)

384

385 def _array_gen(self, schema: dict[str, Any]) -> list[Any]: (empty)

386 """Generate an array from a JSON Schema array."""

387 data: list[Any] = [] (empty)

388 unique_items = schema.get('uniqueItems') (empty)

389 if prefix_items := schema.get('prefixItems'): (empty)

390 for item in prefix_items: (empty)

391 data.append(self._gen_any(item)) (empty)

392 if unique_items: (empty)

393 self.seed += 1 (empty)

394

395 items_schema = schema.get('items', {}) (empty)

396 min_items = schema.get('minItems', 0) (empty)

397 if min_items > len(data): (empty)

398 for _ in range(min_items - len(data)): (empty)

399 data.append(self._gen_any(items_schema)) (empty)

400 if unique_items: (empty)

401 self.seed += 1 (empty)

402 elif items_schema: (empty)

403 # if there is an `items` schema, add an item unless it would break `maxItems` rule

404 max_items = schema.get('maxItems') (empty)

405 if max_items is None or max_items > len(data): (empty)

406 data.append(self._gen_any(items_schema)) (empty)

407 if unique_items: (empty)

408 self.seed += 1 (empty)

409

410 return data (empty)

411

412 def _char(self) -> str: (empty)

413 """Generate a character on the same principle as Excel columns, e.g. a-z, aa-az..."""

414 chars = len(_chars) (empty)

415 s = '' (empty)

416 rem = self.seed // chars (empty)

417 while rem > 0: (empty)

418 s += _chars[(rem - 1) % chars] (empty)

419 rem //= chars (empty)

420 s += _chars[self.seed % chars] (empty)

421 return s (empty)

422

423

424def _get_string_usage(text: str) -> Usage: (empty)

425 response_tokens = _estimate_string_tokens(text) (empty)

426 return Usage(response_tokens=response_tokens, total_tokens=response_tokens) (empty)