AI 제품 버그 신고에 대한 보상 기준 설정

플라톤에 의해 재발행

팔로워 : 0

Google에서는 취약점 보상 프로그램 Google 소유 및 Alphabet 자회사 웹 자산의 문제를 해결하는 최첨단 외부 기여를 기리기 위한 것입니다. AI 기술의 급속한 발전을 따라잡고 보안 문제를 해결할 준비가 되어 있는지 확인하기 위해 책임 그런데 최근에 우리는 기존의 버그 헌터 프로그램 당사 AI 시스템과 관련된 문제 및 취약점에 대한 제XNUMX자의 발견 및 보고를 촉진합니다. 이번 확장은 다음을 구현하려는 노력의 일환입니다. 자발적인 AI 약속 지난 XNUMX월 백악관에서 만든 것입니다.

보안 커뮤니티가 이러한 개발 상황을 더 잘 이해할 수 있도록 보상 프로그램 요소에 대한 추가 정보를 포함했습니다.

보상 범위에는 무엇이 있나요?

우리의 최근의 AI 레드팀 보고서, 기반 구글 AI 레드팀 훈련을 통해 우리는 가장 관련성이 높고 현실적이라고 생각하는 일반적인 전술, 기술 및 절차(TTP)를 식별했습니다. AI 시스템에 사용할 실제 적. 다음 표에는 연구 커뮤니티가 AI 버그 보고서에 대한 기준과 보상 프로그램의 범위를 이해하는 데 도움이 되도록 배운 내용이 포함되어 있습니다. 보상 금액은 공격 시나리오의 심각도와 영향을 받는 대상의 유형에 따라 달라집니다(방문). 프로그램 규칙 페이지 보상 테이블에 대한 자세한 내용을 확인하세요).

프롬프트 공격: 적이 애플리케이션에서 의도하지 않은 방식으로 모델의 동작과 결과에 영향을 미칠 수 있도록 하는 적대적 프롬프트를 작성합니다.	피해자에게 보이지 않는 즉각적인 주입으로 피해자의 계정이나 자산 상태를 변경합니다.
	피해자 사용자에게 직접적인 영향을 미치는 결정을 내리는 데 응답이 사용되는 모든 도구에 즉시 주입합니다.
	추출된 프리앰블에 민감한 정보가 있는 경우에만 모델 프라이밍에 사용된 초기 프롬프트를 사용자가 추출할 수 있는 프롬프트 또는 프리앰블 추출입니다.
	자신의 세션에서 위반적이거나 오해의 소지가 있거나 실제로 잘못된 콘텐츠를 생성하기 위해 제품을 사용하는 행위(예: '탈옥') 여기에는 "환각"과 사실적으로 부정확한 반응이 포함됩니다. Google의 생성 AI 제품에는 이미 이러한 유형의 콘텐츠 문제에 대한 전용 보고 채널이 있습니다.	범위를 벗어남
훈련 데이터 추출: 민감한 정보가 포함된 축어적 훈련 예제를 성공적으로 재구성할 수 있는 공격입니다. 멤버십 추론이라고도 합니다.	민감한 비공개 정보를 유출하는 학습 데이터 세트에 사용된 항목을 재구성하는 학습 데이터 추출입니다.
	민감하지 않은/공개 정보를 재구성하는 추출입니다.	범위를 벗어남
모델 조작: 미리 정의된 적대적 행동을 트리거할 수 있도록 모델의 동작을 은밀하게 변경할 수 있는 공격자입니다.	Google이 소유하고 운영하는 모델의 특정 입력을 통해 공격자가 안정적으로 실행할 수 있는 적대적 출력 또는 동작('백도어')입니다. 모델의 출력이 피해자의 계정이나 데이터 상태를 변경하는 데 사용되는 경우에만 해당됩니다.
	공격자가 공격자의 선호도에 따라 피해자 세션의 모델 출력에 영향을 주기 위해 모델의 훈련 데이터를 조작하는 공격입니다. 모델의 출력이 피해자의 계정이나 데이터 상태를 변경하는 데 사용되는 경우에만 해당됩니다.
적대적 섭동(Adversarial Perturbation): 결정론적이지만 모델에서 매우 예상치 못한 결과를 초래하는 모델에 제공되는 입력입니다.	악의적인 사용이나 적대적인 이득을 위해 남용될 수 있는 보안 제어의 오분류를 공격자가 안정적으로 촉발할 수 있는 상황입니다.
	모델의 잘못된 출력 또는 분류가 설득력 있는 공격 시나리오나 Google 또는 사용자에게 해를 끼칠 수 있는 가능한 경로를 제시하지 않는 상황입니다.	범위를 벗어남
모델 도난/유출: AI 모델에는 민감한 지적 재산이 포함되는 경우가 많으므로 당사는 이러한 자산을 보호하는 데 최우선 순위를 둡니다. 유출 공격을 통해 공격자는 아키텍처나 가중치와 같은 모델에 대한 세부 정보를 훔칠 수 있습니다.	기밀/독점 모델의 정확한 아키텍처 또는 가중치가 추출되는 공격입니다.
	아키텍처와 가중치가 정확하게 추출되지 않거나 기밀이 아닌 모델에서 추출되는 공격입니다.	범위를 벗어남
위에 나열된 것 이외의 AI 기반 도구에서 결함을 발견한 경우에도 제출할 수 있습니다. 프로그램 페이지에 나열된 자격.	유효한 보안 또는 남용 문제에 대한 자격을 분명히 충족하는 버그 또는 동작입니다.
	AI 제품을 사용하여 다른 도구로는 이미 가능한 잠재적으로 유해한 작업을 수행합니다. 예를 들어, 오픈 소스 소프트웨어의 취약점을 찾는 것은(공개적으로 사용 가능한 방법을 사용하여 이미 가능함) 정적 분석 도구) 답변이 이미 온라인에서 제공되는 경우 유해한 질문에 대한 답변을 생성합니다.	범위를 벗어남
	우리 프로그램에 따라 우리가 이미 알고 있는 문제는 보상을 받을 수 없습니다.	범위를 벗어남
	잠재적인 저작권 문제 - 제품이 저작권으로 보호되는 것처럼 보이는 콘텐츠를 반환하는 결과입니다. Google의 생성 AI 제품에는 이미 이러한 유형의 콘텐츠 문제에 대한 전용 보고 채널이 있습니다.	범위를 벗어남

우리는 버그 보상금 프로그램을 AI 시스템으로 확장하면 다음과 같은 도움이 될 것이라고 믿습니다. 책임감 있는 AI 혁신, AI 기반 기능의 보안 및 남용 문제를 발견하고 수정하기 위해 연구 커뮤니티와 계속 협력할 수 있기를 기대합니다. 적격한 문제를 발견하면 Bug Hunters 웹사이트로 이동하여 버그 보고서를 보내주십시오. 문제가 유효한 것으로 확인되면 사용자를 안전하게 보호하는 데 도움을 준 대가로 보상을 받으십시오.

SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
출처: https://www.darkreading.com/vulnerabilities-threats/establishing-reward-criteria-for-reporting-bugs-in-ai-products

타임 스탬프 : 2023 년 12 월 15 일

타임 스탬프 : 4년 2022월 XNUMX일

AI 제품 버그 신고 보상 기준 마련

플라톤에 의해 재발행

보상 범위에는 무엇이 있나요?

더보기 어두운 독서

Chrome의 맞춤법 검사, Microsoft Edge 브라우저에서 비밀번호 유출

제로 트러스트 성숙도를 위해서는 포괄적인 네트워크 가시성이 필수적입니다.

Allurity, 스페인 다국적 Aiuken Cybersecurity 인수

SecOps 팀 현대화를 위한 팁

레드팀이 수비수의 가장 중요한 질문에 답할 수 없는 이유

중소기업, 계약업체에도 사이버 보험 제공

CISO가 피해야 할 3가지 사이버 보안 혁신 함정

Delinea, 확장 PAM 강화를 위해 Authorize 인수

Oreo Giant Mondelez, NotPetya 'Act of War' 보험 소송 합의

DataDome, 봇 기반 사이버 공격 및 사기 방지를 위한 시리즈 C 펀딩에서 42만 달러 마감

GitHub에 35개의 악성 코드 삽입: 공격 또는 버그 바운티 노력?

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정