SafetyCo가 전쟁을 가다: Anthropic, DOD, 그리고 이상 기반 프레임워크의 한계

SafetyCo가 전쟁을 가지면: Anthropic, 미국 정부, 그리고 이상 기반 프레임워크의 한계

뭔가 잘 보이지 않을 것 같은 일을 하고 싶을 때 표준 사일런트 밸리 움직임이 있는데: 먼저 프레임워크를 만들고, 그게 뭔가 하고 싶은 일과 프레임워크와 일치한다고 설명하는 것. Anthropic는 자신의 공로로 진정으로 윤리 기반의 엄격한 프레임워크를 구축했습니다 - 헌법 기반 인공지능(Constitutional AI), 책임 있는 확장 정책(Responsible Scaling Policy), 그리고 실질적인 힘을 가진 사용 가능 정책(Acceptable Use Policy). 그런 다음 Palantir을 통해 국방부와 파트너십을 맺는 순간, 정확히 그렇게 했습니다: 프레임워크를 가리키며 말했습니다, "보시다, 우리는 좋습니다."

여기서 Anthropic/DOD 사례가 연구할 가치 있는 것은 결정이 맞았는지 틀렸는지가 아니라, 결정이 반영하는 것들에 대한 것입니다. 이는 이념 기반 회사가 상업적 압력을 어떻게 대처하는지에 대한 것이며, 프레임워크가 실제로 무언가를 보호했는지, 아니면 유용한 가리개만 제공했는지 여부입니다.

설정: "아니오"라고 말한 회사

Anthropic은 2021년에 OpenAI의 전 리더들에 의해 창립되었으며, 많은 이들이 특별히 AI 안전이 충분히 중요하게 여겨지지 않는다고 생각해서 떠났습니다. 창립의 전제는 강력한 AI를 구축하지만, 그것을 신중하게 구축하는 것입니다.는 위험과 유해한 응용 프로그램에 대한 투명성과 엄격한 제한을 가지고 있습니다. Claude의 사용 정책은 출시일부터 무기 개발, 군사적 목표 지정, 대규모 감시, 그리고 대규모 피해를 유발하도록 설계된 콘텐츠를 명시적으로 금지했습니다 [1].

몇 년 동안 이 포지셔닝은 진심이었고 편리했다. AI 안전 통로는 혼잡하지 않았고, 브랜드는 차별화되었으며, 방어 부문은 문을 두드리지 않았다. 하지만 계산은 빠르게 변했다. 2024년 말까지 AI는 국가 안보 우선순위가 되었고, 연방 정부는 AI 계약에 적극적으로 지출하고 있었으며,Anthropic의 경쟁자인 OpenAI, Google, Microsoft는 모두 다양한 방식으로 정부 공간으로 나아가고 있었다 [2].

돈은 그곳에 있었다. 문제는 원칙들이 그것과 접촉하여 생존할 수 있는지 여부였다.

실제로 무엇이 일어났는가

2024년 말, Anthropic은 Palantir과 AWS와의 파트너십을 발표하여 클라우드 비밀 환경을 통해 Claude를 미국의 정부 기관과 국방부에 제공할 것이라고 밝혔습니다 [3]. Anthropic이 공개적으로 지지한 사용 사례는 매우 신중하게 제한되었습니다: 물류 최적화, 인력 의사 결정 지원, 정보 분석. 자율 무기는 아니요. 타격 시스템은 아니요. Claude를 살의 연쇄에 끼치는 어떤 것도 아닙니다.

정확한 기술 사항은 중요했습니다. Anthropic은 두 가지 구체적인 운영적 엄격한 한계를 설정했습니다: 미국 시민에 대한 대규모 감시는 없으며, 완전히 자율적인 무기 시스템(인간 조종자의 개입 없이 목표를 식별하고 선택하고 투사할 수 있는 것)은 없습니다 [4]. 이것은 모호한 희망적인 한계가 아니었습니다. 구체적인 계약 요구 사항이었습니다.

아모디는 주의 깊게 구별하며 말했다: "오늘 우크라이나에서 사용되는 것과 같은 일부 자율 무기는 민주주의의 방어에 중요합니다." 반대는 무기 시스템에 인공지능이 아닌 것입니다. 전적으로 인간을 타겟 결정에서 제외하는 것에 반대했습니다. "전장 인공지능 시스템은 완전히 자율 무기를 작동하기에 충분히 신뢰할 수 없습니다,"라고 그는 썼습니다 [5].

펜타곤의 반응: 그 조건들은 작전적으로 현실적이지 않다. Pete Hegseth 장관의 사무소는 "어떤 법적 사용"에 대한 접근을 강력히 주장했다 — 예외는 없으며, 인간 감독 요건도 없다. Anthropic가 자신의 입장을 유지할 때, 국방부는 Anthropic을 "공급망 위험"으로 지정할 위협을 하며, 이는 외국적 적대 세력에게 일반적으로 예약되어 있는 국가 안보 라벨이었다 [4].

공식 성명에서 아모디는 클로드의 역할을 "정보 분석, 모델링 및 시뮬레이션, 운영 계획, 사이버 작전 등 중요한 임무 애플리케이션을 포함한" 것으로 묘사했습니다 [5]. 책임 있는 확장 정책은 허용되는 사용 분류를 통제할 것입니다 [6]. 헌법 AI의 훈련 제약은 그대로 유지될 것입니다 [7].

2026년 2월까지 Anthropic은 압력에 따라 일부 제약 조건을 약화시켰습니다 [4]. 하지만 그들은 전적으로 제거하지 않았습니다. Amodei는 공개적으로 회사가 "제한 없는 접근에 대해 정의로운 마음으로 동의할 수 없다"고 밝혔습니다 [5].

행정부의 반응은 신속했습니다. 2026년 3월 초, 트럼프 행정부는 연방 기관들에 클로드를 사용 중지하도록 지시하고 공급망 위험 지정을 공식적으로 실행했습니다 [8]. 패نت곤은 기존 구현을 단계적으로 폐지할 시간을 6개월을 받았습니다. 관료들은 "주요 민사 및 형사적 결과" [8]를 위협하고 방위 생산법 [5]를 발동했습니다. 트럼프 대통령은 트루스 소셜에서 안토픽을 "왼쪽 성향의 비정상자들"라고 부르었습니다 [8].

아모디가 내재된 모순을 지적했다: 행정부는 동시에 Anthropic을 보안 위험으로 지정하고 Claude가 국가 안보에 필수적이라고 주장했다 [5].

이것은 프레임워크가 드물게 하는 일을 하고 있다: 실제 비용을 치르며 한계를 설정한다. 질문은: 그것이 우리에게 무엇을 말해줄까?

프레임워크 주장

진정한 사례가 있었다. Anthropic이 이 결정에 대한 접근 방식은 대부분의 기술 회사가 유사한 질문에 대해 가져오는 원칙보다 더 원칙적인 방식이었다.

2018년 구글의 프로젝트 마블과의 대조를 생각해보십시오. 엔지니어들이 구글이 의미 있는 내부 심의 없이 받아들인 드론 이미지 분석 DOD 계약에 반대했습니다 [9]. 또는 마이크로소프트의 JEDI 클라우드 계약에서 윤리 검토 절차는本质上 법적 및 명성 위험 평가였으며, 가치 연습이 아니었습니다 [10]. 모든 경우에, 회사는 먼저 예를 들고 나중에 윤리를 생각했지만, 그렇지 않은 경우도 있었습니다.

Anthropic는 최소한 결정하기 전에 공공장소에서 대답을 했다. 금지된 사용 범주를 정의했다미리. 이는 파트너십을 기존 정책 제약에 묶는 대신 새로운, 더 엄격한 제약을 만드는 것이 아니었다. 기술 산업의 방어 계약 기준으로는 이는 매우 엄격한 접근이다.

DOD 갈등 이전에 프레임워크는 이미 낮은 프로파일로 테스트되었습니다. Anthropic는 자발적으로 중국 공산당과 연관된 회사들이 Claude를 사용하는 것을 제한하기 위해 "수백만 달러 규모의 수익"을 포기했으며, 중국 공산당이 지원하는 사이버 공격을 중단하여 Claude를 악용하려는 시도를 막았습니다 [5]. 이것은 윤리극입니다. 누군가 관찰하기 전에, 회사가 명시된 제한을 강제하기 위해 실질적인 재정적 비용을 감수하는 것입니다.

그 규율은 결국 출입구까지 확장되었습니다: Anthropic은 법적 결과에 대한 위협에도 불구하고 자신의 제약을 완전히 제거하지 않았고, 전체 프레임워크를 포기하기보다는 계약을 잃었습니다. Google도 OpenAI도 이런 결과를 겪지 못했습니다. 왜냐하면 두 기업 모두 정부가 불편하게 여기는 선을 긋지 않았기 때문입니다.

프레임워크는 또한 진정한 철학적 입장을 반영합니다: 강력한 인공지능이 권위주의 정부나 비국가 행위자의 손에 들어가는 것이 더욱는 미국 정부의 감독 하에 배치된 강력한 인공지능보다 위험합니다. 인공지능 안전 관점에서는 이 주장이 일리가 있습니다. Claude가 군사적 결정을 안내할 것이라면, 안전을 중심으로 하는 회사가 회의에 참여하는 것이 덜 성실한 개발자들에게 그 영역을 넘겨주는 것보다 낫습니다.

비판적인 해석

하지만 프레임워크는 실패 모드를 가지고 있으며, 이것은 여러 가지 명백한 실패 모드를 가지고 있습니다.

인증 문제. Anthropic의 제약 조건은 Palantir과 DOD가 실제로 사용 사례 경계를 존중하느냐에 달려 있습니다. Anthropic은 Claude가 금지된 것을 사용하고 있는지 어떻게 알 수 있을까요? 분류된 환경은 설계적으로 감사할 수 없습니다. 프레임워크는 원칙적으로 책임성을 제공하지만, 실제로 거의 제공하지 않습니다.

수익 문제. 회사가 고객과 연결된 수익의 중요한 부분을 가지고 있다면 권력 구도가 바뀝니다. Claude가 허용되어야 할 행동에 대한 미래 정책 논쟁은 '아니오'라고 말하는 것이 실제 재정적 결과를 초래하는 맥락에서 일어날 것입니다. 수익이 존재하기 전에 작성된 프레임워크는 수익을 거부하여 강제하는 프레임워크보다 항상 방어하기 쉽습니다.

선례 문제입니다. 이 결정의 가장 중요한 효과는 Palantir 거래 자체가 아닙니다. 그것은 내부적으로 보내는 신호 - 직원들에게, 미래의 리더십에게, 투자자들에게 - 어떤 종류의 희생이 허용될 수 있는지에 대한 것입니다. 모든 이후의 "이게 괜찮은가?" 결정은 이것에 의해 근거지 될 것입니다. 프레임이 바뀝니다.

정의 문제. 허용 가능한 사용 사례로 간주되는 것은 무거운 질문입니다. 물류 최적화는 쉬운 결정입니다. 외국 인구에 대한 감정 분석? 비자 신청자에 대한 자동 위험 평가? 민간 혼란에 대한 예측 위협 모델링? 이는 스펙트럼에 존재하며, 언론 발표에서 들리는 깨끗한 경계는 적대적인 운영 압력 하에서 지지하지 못합니다. 클로드는 베네수엘라의 대통령 니콜라스 마두로를 겨냥한 작전을 둘러싼 정보 및 계획 워크플로우에 통합되었다고 보고됩니다 [4]. "정보 분석"은 허용된 사용 사례 목록에 있었습니다. 정보 분석이란, 결과적으로 광범위한 범주임이 드러났습니다.

개념 증명 문제. 우리는 더 이상 Anthropic가 압력에 굴복할지 여부를 추측할 필요가 없습니다. 2026년 2월, 그들은 굴복했습니다. 펜타곤의 국가 안보 공급망 위험으로 지정할 위협에 직면해 Anthropic는 공개적으로 약속한 보호 장치를 약화시켰습니다 [4]. 하지만 그 이후에는 더 단호한 입장을 취하고, 완전한 준수를 거부했으며, 그에 따른 금지를 받았습니다 [8]. 증거는 진정으로 혼재되어 있습니다: 프레임워크는 압력 아래 움직였지만, 회사가 비즈니스를 잃는 것을 원하는 지점에서 움직임을 멈췄습니다. 그것은 대부분의 프레임워크가 하는 것보다 더 많습니다. 동시에 그것은 외부에서 단호한 입장처럼 보이는 것보다 덜합니다.

이것은 진정으로 사례 연구입니다

Anthropic/DOD 상황은 주로 군사 윤리나 AI 정책과 관련되지 않습니다. 가치에 기반한 회사가 충분히 크게 성장해서 가치가 실제 경제적 결과를 초래할 때 발생하는 일에 대한 사례 연구입니다.

이 지위에 있는 모든 회사는 같은 발견을 합니다: 아무것도 잃지 않을 때 작성한 프레임워크는 실제 돈을 놓치는 것을 의미하는 경우에 강제하는 것이 매우 다르게 보입니다. 이상에 기반한 프레임워크의 테스트는 쉬운 결정을 안내하는지 여부가 아니라 어려운 결정을 안내하는지 여부입니다. 인스턴스들. DOD의 결정은 어려웠다. Anthropic이 전화를 걸었다. 그 전화가 옳았는지는 우리가 지금 답하기 시작하는 경험적 질문에 달려있다. 제약 조건은 2026년 2월에 유연해졌지만, 더 기본적인 수준에서도 유지되었다 — 회사는 계약을 완전히 포기하기보다 계약을 잃었다.

우리는 할 수 있습니다는 그 과정이 대부분보다 더 정직했다고 말했다. Anthropic은 결정이 쉽지 않았다는 것을 속이지 않았다. 그들은 정책을 조용히 확장하지 않았고, 대중 앞에서 자신들이 내는 확장을 방어했다. 그들은 경계를 긋았다 — 심지어 그 경계가 집행하기 어려울 수도 있다는 것을 알면서도.

Management 교훈

이 이야기의 버전이 모든 성장하는 회사의 리더가 결국 겪게 될 것이다. 당신은 프레임워크를 가지고 있으니 — 가치관, 미션, 운영 방식에 대한 공적인 약속의 집합이다. 그런데 누군가 체크를 들고 들어와서 그것을 테스트할 만큼 충분히 큰 돈을 가지고 온다.

함정은 '예'라고 말하는 것이 아니라, '예'라고 말하는 것이 선을 이동하지 않는다고 속이는 것이 아니다. Anthropic는 '예'라고 말했지만, 동시에 '예'라고 말했다:여기가 경계선이며, 여기가 우리가 이 결정이 올바른 쪽에 있다고 믿는 이유입니다그것은 방어할 수 있는 입장입니다. 방어할 수 없는 것은 수익을 받고 아무도 이전에 정의를 바꾸었음을 주목하지 않기를 바라는 것입니다.

가치에 중점을 둔 조직을 만드는 경영진에게, Anthropic 사례는 실용적인 모델을 제공합니다: 압력이 앞서어서는 안 됩니다. 만약 당신이 AI 윤리 정책을 작성하고 있다면이후 DOD 호출은, 당신이 제약 조건을 작성하는 것이 아니라 합리화를 작성하고 있습니다. AI 시대에 진정한 윤리적 지위를 유지할 회사들은 프레임워크를 실질적으로 만드는 곳입니다이전 필요할 때까지 — 이는 낮은 스테이크의 순간에 결정을 내려 프레임워크가 힘이 있다는 것을 증명하는 것을 의미합니다.

Anthropic은 그렇게 했는데, 대부분 그랬습니다. 이빨은 2026년 2월에 굽혀졌고, 그 뒤로는 회사가 손실을 감수할 수 있는 선까지 유지되었습니다. 경영진에게는 실질적인 교훈이 있습니다: 압박이 와오기 전에 프레임워크를 구축하고, 그 뒤로 얼마나 움직일지 미리 결정해야 합니다 — 왜냐하면 압박이 와오는 시점에는 이미 당신이 만든 문화에 의해 결정이 내려진 것입니다.

The Verdict

여기 답변이 있습니다: Anthropic가 일부 굽히고 그 다음에 들어섰습니다. 정부는 그들의 위협을 실행했습니다. Claude는 이제 공식적으로 최소 6개월 동안 연방 배치에서 공식적으로 퇴역했습니다 [8]. 은퇴한 장군 Jack Shanahan은 Anthropic의 보안 장치를 "합리적인"이라고 칭찬하며 행정부의 결정이 "주의 깊은 분석에 의해 주도되었는지 정치적 고려 사항에 의해 주도되었는지" 의문을 제기했습니다 [8].

산업 경쟁 상황은 명확합니다. 구글은 2025년에 무기 배제 선언을 철회했습니다. 오픈AI는 2026년 2월에 미션 스테이트먼트에서 '안전'을 제외했습니다 [4]. 두 기업 모두 회의실에 남아있었습니다. 앙스로피크는 완전히 넘어서지 않겠다는 선을 긋고 추방당했습니다. 지금 모든 다른 AI 기업이 내부화하고 있는 교훈은 다음과 같습니다: 고객이 미국 정부이고 행정부가 그들에 적대적일 때 윤리적 제약은 취약점입니다.

더 어려운 질문은 이것입니다: 프레임워크를 가지고 있으면 사업을 잃는 것일 때, 프레임워크는 성공인가 실패인가요?

낙관적인 해석: 프레임워크가 작동했습니다. Anthropic이 윤리적으로 받아들일 수 없는 요구에 완전히 굴복하지 않도록 방지했습니다. 회사는 제약을 완전히 포기하지 않고 실제 결과를 받아들였습니다. 그것이 책임감의 실제 모습입니다.

비관적인 해석은: Anthropic이 이제 정부 AI에서 나갔다고 읽는다. 덜 정직한 개발자(불편한 윤리적 프레임워크가 없는 사람들)가 그 공간을 채울 것이다. 시장은 용화를 선택하고 원칙적인 회사는 처벌받는다. 실제 군사 시스템에서 AI가 하는 일에 미치는 총 효과는 부정적이다.

두 해석 모두 동시에 맞을 가능성이 높다. 그것이 이 사례가 연구할 가치 있는 이유다.

더 넓은 선례 우려도 있습니다: 행정부는 도덕적 기준을 유지하는 국내 회사를 대상으로 연방 구매를 무기화했습니다 [8]. 만약 그 패턴이 유지된다면, 나머지 기술 산업에 미치는 억압적인 효과는 상당할 것입니다. 다른 누구도 국가 안보 위협으로 지정받을 수 있는 선을 긋지 않을 것입니다.

Anthropic의 입장이 전략적으로 현명했는지 여부는 그것이 원칙적인지 여부와는 별개의 질문입니다. 명백히 후자였습니다.前者는 다음 몇 년 동안 정부 AI에서 일어나는 일과 미국 정부가 다시 한번 경계 장치가 있는 회사들이 협력할 가치가 있는 파트너임을 결정하느냐에 달려 있습니다.

Anthropic은 경쟁에서 밀려 계약을 잃었습니다. Google과 OpenAI는 경쟁에서 밀리지 않고 자신들의 계약을 유지했습니다. 어떤 접근 방식이 AI 시스템에 영향을 받을 사람들에게 더 나은 결과를 가져다줄까요? 그것은 아직 아무도 잘 답하지 못한 질문입니다 — 그것을 고민해 본 사람들의 의견을 들고 싶습니다.

참고 문헌

Anthropic 사용 약관
OpenAI가 조용히 "군사와 전쟁"에 대한 ChatGPT 사용 금지를 삭제하였다 (2024년 1월) — The Intercept
Anthropic와 Palantir이 클로드 AI 모델을 AWS에 가져오기로 협력하여 미국 정부 정보 및 방위 작전에 활용 (2024년 11월) — Palantir 발표문
펜타곤과 Anthropic 간 군사 AI 가이드라인 갈등 (2026년 2월) — 법률 의견 (도레시, 슈워츠, 보드, 아사드, 레니치 / 법률 리뷰에 대한 독립 자문 위원회, 디자인 비전 인스티튜트)
워드 부서와의 논의에 대해 다리오 아모데이의 발표문 — 안토픽, 2026
안토픽 책임 있는 확장 정책
헌법 AI: AI 피드백에서 오는 해악 없음 — 바이 등, 안토픽, 2022
인도우미니즘 금지: 윤리적 경계가 정부의 목표가 되었을 때 (2026년 3월) — 정책 안정
구글 직원, 군사용 인공지능 프로그램에 반대하여 퇴사 (2018년 5월 17일) — KQED
마이크로소프트, 100억 달러 패نت골드 계약의 예상치 못한 수혜자 (2019년 10월) - 와이어드 매거진

이것이 공감되셨다면, 관련 기사들이 있습니다:

MCP: 약속, 위험, 그리고 실질적인 전략
당신의 AI 업무가 왜 안 좋은가

키티 맥케이는 EY-파르테논의 소프트웨어 전략 그룹(SSG)의 CTO로, 프라이빗 에퀴티와 기업 고객을 위한 인공지능 혁신 및 기술 심사에 특화되어 있습니다. SSG의 인공지능 혁신 연구소는 인공지능이 기존 비즈니스 모델과 가치 사슬을 어떻게 변화시키고 위협하는지를 신속하게 평가합니다. 키티는 노스이스트ern 대학에서 가르치고 있으며, 인공지능, 전략, 관리, 기술 관련 주제에 대해 씁니다.

추천 피드

DEV Community