Torna al blog
Anthropic20 aprile 20265 min di lettura

Claude Haiku 4.5: velocità near-frontier e il paradigma dei sub-agenti

Analisi di Claude Haiku 4.5, il modello compatto rilasciato da Anthropic il 15 ottobre 2025. Prestazioni paragonabili a Sonnet 4 a un terzo del costo, extended thinking introdotto sulla fascia Haiku, e il nuovo pattern di orchestrazione multi-agent con Sonnet come coordinatore.

Di AI Expert

Introduzione

Il 15 ottobre 2025 Anthropic ha rilasciato Claude Haiku 4.5, il modello compatto della famiglia Claude 4.5. La release ha colmato un vuoto rilevante: Haiku 3.5, il modello precedente della stessa fascia, era fermo a fine 2024 e per quasi un anno la categoria "small and fast" della linea Claude era rimasta senza aggiornamenti mentre Sonnet e Opus evolvevano rapidamente.

La proposta di valore di Haiku 4.5 è dichiarata in modo netto da Anthropic: performance paragonabili a Claude Sonnet 4 (state-of-the-art al suo lancio cinque mesi prima) a circa un terzo del costo e oltre il doppio della velocità. È un posizionamento che segnala una traiettoria strutturale del mercato: la capacità "frontier" di ieri diventa economicamente accessibile oggi.

Caratteristiche tecniche

Al lancio, Haiku 4.5 arriva con queste specifiche:

  • Pricing: 1 dollaro per milione di token in input, 5 dollari per milione in output
  • Finestra di contesto: 200.000 token (con accesso a 1M token disponibile sul Claude Developer Platform)
  • Max output: 64K token
  • Identificativo API: claude-haiku-4-5
  • Identificativo Bedrock: anthropic.claude-haiku-4-5-20251001-v1:0
  • Knowledge cutoff: febbraio 2025
  • Reasoning: supportato (nuovo per la fascia Haiku)
  • Disponibilità: Claude.ai (web, iOS, Android), Claude API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry, Claude Code
  • Ottimizzazioni di costo: fino al 90% con prompt caching, 50% con batch processing

Un dato di contesto utile: solo sei mesi prima, il livello di performance di Haiku 4.5 sarebbe stato state-of-the-art sui benchmark interni di Anthropic. Il modello gira 4-5 volte più velocemente di Sonnet 4.5 a una frazione del costo.

Extended thinking: la novità architetturale

La differenza più rilevante rispetto alla generazione precedente è l'introduzione del hybrid reasoning — un elemento inedito per la linea Haiku. Haiku 3.5 non aveva alcuna modalità di extended thinking; Haiku 4.5 la eredita dalla linea 4.5 come modalità opzionale.

Di default Haiku 4.5 risponde rapidamente, ma gli utenti possono attivare una extended thinking mode in cui il modello alloca tempo aggiuntivo per ragionare prima di rispondere. Quando questa modalità è attiva, gli utenti possono accedere alla chain-of-thought — il "processo di pensiero" che Anthropic descrive comunque con cautela, notando che il suo grado di fedeltà rispetto al ragionamento effettivamente eseguito è incerto.

Un altro dettaglio tecnicamente interessante: Anthropic ha addestrato Haiku 4.5 con context window awareness esplicita, ovvero il modello riceve informazioni precise su quanto contesto ha già consumato. È una scelta che aiuta il modello a tracciare il proprio utilizzo di memoria durante operazioni lunghe — utile soprattutto in scenari agentici.

Benchmark rilevanti

I numeri pubblicati al lancio posizionano Haiku 4.5 in una zona che fino a pochi mesi prima era appannaggio dei modelli "large":

  • SWE-bench Verified: 73,3% — fra i migliori modelli di coding al mondo
  • Su computer use e agentic tasks: comparabile con Sonnet 4
  • Accuratezza instruction-following su task specifici (come slide text generation riportato da un partner): 65%, contro il 44% del tier premium precedente

In altre parole, su alcuni benchmark specifici Haiku 4.5 supera addirittura Sonnet 4 — il modello che doveva ispirarsi.

Il nuovo paradigma: orchestrazione multi-agent

Il caso d'uso che Anthropic ha messo al centro del lancio non è "sostituisci Sonnet con Haiku quando ti basta". È l'orchestrazione multi-agent: Sonnet 4.5 decompone un problema complesso in un piano multi-step, poi coordina un team di istanze Haiku 4.5 parallele che eseguono i sotto-task.

Il pattern è leggibile così:

  • Sonnet 4.5 come "captain": planning, decomposizione, sintesi finale
  • Haiku 4.5 come sub-agent: esecuzione in parallelo di task specifici

Questo è anche il pattern che Claude Code ha iniziato ad adottare internamente. Per agent orchestration, refactor estesi, migrazioni di codebase e large feature build, la combinazione Sonnet+Haiku offre quello che Anthropic definisce un compromesso inedito fra qualità e velocità/costo.

Un esempio concettuale di chiamata multi-agent via API:

import anthropic
import asyncio

client = anthropic.AsyncAnthropic()

async def sub_agent_task(task_description: str):
    response = await client.messages.create(
        model="claude-haiku-4-5",
        max_tokens=2048,
        messages=[{"role": "user", "content": task_description}]
    )
    return response.content[0].text

async def orchestrate():
    # Sonnet decompone il problema
    plan = await client.messages.create(
        model="claude-sonnet-4-5",
        max_tokens=2048,
        messages=[{"role": "user", "content": "Refactora questo modulo..."}]
    )
    
    # Haiku esegue i sotto-task in parallelo
    subtasks = parse_plan(plan.content[0].text)
    results = await asyncio.gather(*[sub_agent_task(t) for t in subtasks])
    
    # Sonnet aggrega i risultati
    return await synthesize(results)

Casi d'uso ideali

Anthropic ha identificato esplicitamente diverse aree dove Haiku 4.5 produce impatto concreto:

  • Customer service agents e chatbot real-time: la responsività diventa critica, e Haiku 4.5 ha una latenza paragonabile alla generazione precedente ma con qualità sostanzialmente superiore
  • Free tier e applicazioni budget-conscious: il prezzo rende sostenibile alzare l'asticella di qualità anche per utenti non paganti
  • Monitoring di stream di dati multipli: regulatory changes, market signals, portfolio risk tracciati simultaneamente
  • Review parallela di literature: decine di fonti di ricerca elaborate in ore invece di settimane
  • Sub-agent per code assistant: GitHub Copilot ha riportato test che mostrano generazione di codice con qualità paragonabile a Sonnet 4 ma a velocità superiore

Conclusione

Claude Haiku 4.5 consolida una tendenza che era già visibile ma che ora si manifesta in modo netto: il gap di capacità fra modelli compatti e flagship si riduce rapidamente, e di conseguenza i punti di decisione architettonica si spostano. La domanda strategica per chi costruisce prodotti AI nel 2026 non è più "qual è il modello più intelligente che posso permettermi?" ma "qual è la combinazione giusta di modelli che minimizza costo e latenza per il mio workflow?".

Tre implicazioni emergono. La prima è che la scalatura delle intelligenze — l'idea che ogni fascia di prezzo abbia il suo Sonnet, il suo Haiku, il suo sub-agente — sta sostituendo la logica del singolo modello universale. La seconda è che la multi-agent orchestration diventa un pattern di sistema di prima classe, non più una curiosità accademica; Haiku 4.5 è esplicitamente progettato per essere il "cavallo da lavoro" di architetture gerarchiche. La terza, più concreta, è che il price/performance ratio si sta comprimendo a una velocità che rende difficile costruire modelli economici a tre anni — la "commodity" di oggi potrebbe essere l'intelligenza di Sonnet 4, e quella di domani quella di Opus 4.7.

Per sviluppatori e architect, la conseguenza operativa è semplice: rivalutare i propri stack ogni pochi mesi, perché lo stesso prompt che richiedeva il flagship l'anno scorso oggi gira bene — e a meno — sul modello di fascia intermedia.

Continua a leggere

Altro dal journal

Anthropic20 aprile 20265 min di lettura

Claude Mythos Preview: il modello che Anthropic ha scelto di non rilasciare

Analisi di Claude Mythos Preview, il modello frontier di Anthropic distribuito solo tramite Project Glasswing a un gruppo ristretto di partner per lavoro difensivo di cybersecurity. Migliaia di zero-day scoperti, un bug di 27 anni in OpenBSD, e la prima volta in cui un laboratorio rifiuta apertamente il rilascio generale di un suo modello di punta.

Anthropic20 aprile 20265 min di lettura

Claude Opus 4.7: il ritorno di Anthropic alla vetta dei modelli agentici

Analisi tecnica di Claude Opus 4.7, il modello flagship rilasciato da Anthropic il 16 aprile 2026. Nuovo livello di effort 'xhigh', tokenizer aggiornato, tripla risoluzione immagini e guardrail cyber integrati nel contesto di Project Glasswing.