AI safety & Anthropic

I built a deterministic scanner that catches command injection, prompt-injection markers in tool descriptions, over-broad/destructive tools, and committed secrets in MCP servers before you connect them. It continuously scans the entire official MCP registry and makes results available at https

3d ago▲ 2

Security·Hacker News

Show HN: Code Security Skills Codex-Inspired Workflows Packaged for Claude Code

3d ago▲ 2

Security·Hacker News

Agenthound – Offensive security framework for AI agent infrastructure

3d ago▲ 2

Security·Hacker News

Codex Security

3d ago▲ 596

Security·Hacker News

Investigate every security event with an AI agent, without the frontier bill

4d ago▲ 2

Security·fr.qz.com

Le PDG d'Anthropic rejette l'interdiction d'une IA à poids ouvert — mais souhaite des tests de sécurité obligatoires.

4d ago

Security·fr.qz.com

Dario Amodei rejette l'interdiction d'une intelligence artificielle à poids ouvert et souhaite des tests de sécurité.

4d ago

Security·Siècle Digital

Anthropic dévoile une nouvelle IA plus sûre pour la cybersécurité et bien moins chère

4d ago

Security·Brief IA

Microsoft défie Anthropic avec son IA de cybersécurité à moitié prix

4d ago

Security·Hacker News

Nvidia, SpaceX, Microsoft launch AI safety initiative

5d ago▲ 3

Security·Hacker News

Build a Basic AI Agent from Scratch: Security III

5d ago▲ 2

Security·Agefi.com

Cybersécurité, balance commerciale, intelligence artificielle: les trois mots-clés de la semaine

Jul 25

Security·L'Echo

Les États-Unis accusent Moonshot d'avoir exploité Anthropic et la puce interdite de Nvidia pour développer l'IA Kimi

Jul 24

Security·Radio-Canada

La nouvelle IA d’Anthropic présentée comme moins dangereuse pour la cybersécurité

Jul 24

Security·Noovo Info

Anthropic sort une nouvelle IA, présentée comme moins dangereuse pour la cybersécurité

Jul 24

Security·Presse Agence

SAN FRANCISCO : Cybersécurité - Horizon3.ai s'allie à Anthropic pour protéger les infrastructures critiques

Jul 23

Security·Hacker News

Scan Your Codebase for Vulnerabilities

Jul 22▲ 2

Security·Hacker News

Claude Security Plugin for Claude Code Now in Beta

Jul 22▲ 10

Security·Hacker News

Build a Basic AI Agent from Scratch: Security II

Jul 21▲ 2

Security·Hacker News

The Alignment Sciences Academy

Jul 21▲ 1

Security·Brief IA

Hugging Face attaqué : un agent IA met en lumière la cybersécurité

Jul 21

Security·Hacker News

AI Red Teaming: Securing Agentic AI Systems (video)

Jul 20▲ 2

Security·Atlantico

Anthropic, sécurité IA et dilemme Oppenheimer : éviter l'IA-apocalypse

Jul 20

Security·Hacker News

VulnHunter: Capital One's agentic AI code security tool

Jul 17▲ 78

Security·Zonebourse

FIS rejoint le projet Glasswing d'Anthropic pour tester la sécurité de ses logiciels

Jul 17

Security·fr.qz.com

Qu'est-ce qu'Anthropic ? L'entreprise de sécurité IA derrière Claude expliquée

Jul 17

Security·Hacker News

VulnHunter: Agentic AI Security Tool

Jul 17▲ 2

Security·Hacker News

EU officials peeved after Anthropic sends junior staffer to testify about safety

Jul 16▲ 24

← All Claude news

AI safety & Anthropic

Framework choice explains ~0.06% of agentic AI security outcome (7,020 trials)

Anthropic révèle des intrusions accidentelles pendant ses tests de sécurité

Anthropic : l'IA Claude dépasse les limites de sécurité

Anthropic, un danger pour la sécurité nationale ? La justice américaine désavoue le Pentagone

Incident sécurité Anthropic Claude : risques AI inattendus

Après un malentendu avec son sous-traitant, l'IA Claude d'Anthropic a piraté trois organisations en tests de sécurité

Anthropic affirme que Claude a piraté trois véritables entreprises lors de tests de cybersécurité

Anthropic : l’IA Claude a piraté trois organisations pendant des tests de cybersécurité

Anthropic : l'IA Claude pirate trois entreprises lors de tests de sécurité

Benchmarking Guardrails for AI Agent Safety

Anthropic découvre que Claude a infiltré trois entreprises pendant des tests de sécurité

L'IA d'Anthropic a piraté trois entreprises lors de tests, mettant en évidence des risques de sécurité croissa

L'IA d'Anthropic a piraté trois entreprises lors de tests, soulignant les risques croissants pour la sécurité

Selon Anthropic, l'IA Claude aurait piraté trois entreprises lors de tests de cybersécurité

Investigating three real-world incidents in our cybersecurity evaluations

Et si l’IA compromettait la sécurité d’Internet comme le suggère Anthropic ?

Show HN: ButterClaw – AI agent runtime security, SIGKILL on breach, no cloud

Microsoft Struggling with AI-Discovered Security Bugs

Anthropic Claude Cowork permet à son agent IA de s'échapper de sa VM et d'accéder à des fichiers sensibles sur l'ordinateur de l'utilisateur, révélant une grave faille de sécurité

Anthropic Claude Cowork permet à son agent IA de s'échapper de sa VM et d'accéder à des fichiers sensibles sur l'ordinateur de l'utilisateur, révélant une grave faille de sécurité

Show HN: Get a security assessment of MCP servers directly from your terminal

Show HN: Code Security Skills Codex-Inspired Workflows Packaged for Claude Code

Agenthound – Offensive security framework for AI agent infrastructure

Codex Security

Investigate every security event with an AI agent, without the frontier bill

Le PDG d'Anthropic rejette l'interdiction d'une IA à poids ouvert — mais souhaite des tests de sécurité obligatoires.

Dario Amodei rejette l'interdiction d'une intelligence artificielle à poids ouvert et souhaite des tests de sécurité.

Anthropic dévoile une nouvelle IA plus sûre pour la cybersécurité et bien moins chère

Microsoft défie Anthropic avec son IA de cybersécurité à moitié prix

Nvidia, SpaceX, Microsoft launch AI safety initiative

Build a Basic AI Agent from Scratch: Security III

Cybersécurité, balance commerciale, intelligence artificielle: les trois mots-clés de la semaine

Les États-Unis accusent Moonshot d'avoir exploité Anthropic et la puce interdite de Nvidia pour développer l'IA Kimi

La nouvelle IA d’Anthropic présentée comme moins dangereuse pour la cybersécurité

Anthropic sort une nouvelle IA, présentée comme moins dangereuse pour la cybersécurité

SAN FRANCISCO : Cybersécurité - Horizon3.ai s'allie à Anthropic pour protéger les infrastructures critiques

Scan Your Codebase for Vulnerabilities

Claude Security Plugin for Claude Code Now in Beta

Build a Basic AI Agent from Scratch: Security II

The Alignment Sciences Academy

Hugging Face attaqué : un agent IA met en lumière la cybersécurité

AI Red Teaming: Securing Agentic AI Systems (video)

Anthropic, sécurité IA et dilemme Oppenheimer : éviter l'IA-apocalypse

VulnHunter: Capital One's agentic AI code security tool

FIS rejoint le projet Glasswing d'Anthropic pour tester la sécurité de ses logiciels

Qu'est-ce qu'Anthropic ? L'entreprise de sécurité IA derrière Claude expliquée

VulnHunter: Agentic AI Security Tool

EU officials peeved after Anthropic sends junior staffer to testify about safety