Amazon SageMaker에서 변조 감지를 위한 컴퓨터 비전 모델 훈련 및 호스팅: 2부

플라톤에 의해 재발행

팔로워 : 0

. 첫 번째 부분 3부로 구성된 이 시리즈에서 우리는 모기지 인수 사용 사례에 대해 AWS AI 및 기계 학습(ML) 서비스를 사용하여 대규모 문서 변조 및 사기 탐지를 자동화할 수 있는 방법을 보여주는 솔루션을 제시했습니다.

이 게시물에서는 모기지 인수 시 위조 이미지를 탐지하고 강조하기 위한 딥러닝 기반 컴퓨터 비전 모델을 개발하는 접근 방식을 제시합니다. 우리는 딥 러닝 네트워크 구축, 훈련 및 배포에 대한 지침을 제공합니다. 아마존 세이지 메이커.

3부에서는 솔루션을 구현하는 방법을 보여줍니다. 아마존 사기 탐지기.

솔루션 개요

모기지 인수 시 문서 변조를 탐지하는 목적을 달성하기 위해 우리는 이미지 위조 탐지 솔루션을 위해 SageMaker에서 호스팅되는 컴퓨터 비전 모델을 사용합니다. 이 모델은 테스트 이미지를 입력으로 받고 위조 가능성 예측을 출력으로 생성합니다. 네트워크 아키텍처는 다음 다이어그램에 설명되어 있습니다.

변조 감지 모델 아키텍처

이미지 위조에는 주로 접합, 복사 이동, 제거, 향상의 네 가지 기술이 사용됩니다. 위조품의 특성에 따라 탐지 및 위치 파악의 기반으로 다양한 단서가 사용될 수 있습니다. 이러한 단서에는 JPEG 압축 아티팩트, 가장자리 불일치, 노이즈 패턴, 색상 일관성, 시각적 유사성, EXIF 일관성 및 카메라 모델이 포함됩니다.

이미지 위조 탐지 영역이 광범위하기 때문에 우리는 ELA(Error Level Analysis) 알고리즘을 위조 탐지를 위한 예시 방법으로 사용합니다. 우리는 다음과 같은 이유로 이 게시물에서 ELA 기술을 선택했습니다.

구현이 더 빠르고 이미지 변조를 쉽게 포착할 수 있습니다.
이미지의 여러 부분의 압축 수준을 분석하여 작동합니다. 이를 통해 변조를 나타낼 수 있는 불일치를 감지할 수 있습니다. 예를 들어 다른 압축 수준으로 저장된 다른 이미지에서 한 영역을 복사하여 붙여넣은 경우입니다.
육안으로 발견하기 어려울 수 있는 보다 미묘하거나 원활한 변조를 감지하는 데 적합합니다. 이미지에 작은 변화라도 감지 가능한 압축 이상 현상이 발생할 수 있습니다.
비교를 위해 수정되지 않은 원본 이미지에 의존하지 않습니다. ELA는 문제가 있는 이미지 자체 내에서만 변조 징후를 식별할 수 있습니다. 다른 기술에서는 비교하기 위해 수정되지 않은 원본이 필요한 경우가 많습니다.
이는 디지털 이미지 데이터의 압축 아티팩트 분석에만 의존하는 경량 기술입니다. 전문적인 하드웨어나 법의학 전문 지식에 의존하지 않습니다. 이를 통해 ELA를 첫 번째 분석 도구로 사용할 수 있습니다.
출력 ELA 이미지는 압축 수준의 차이를 명확하게 강조하여 변조된 영역을 눈에 띄게 만듭니다. 이를 통해 비전문가라도 조작 가능성의 징후를 인식할 수 있습니다.
다양한 이미지 유형(예: JPEG, PNG, GIF)에서 작동하며 이미지 자체만 분석하면 됩니다. 다른 포렌식 기술은 형식이나 원본 이미지 요구 사항이 더 제한될 수 있습니다.

그러나 입력 문서(JPEG, PNG, GIF, TIFF, PDF)의 조합이 있을 수 있는 실제 시나리오에서는 ELA를 다음과 같은 다양한 다른 방법과 함께 사용하는 것이 좋습니다. 가장자리의 불일치 감지, 소음 패턴, 색상 균일성, EXIF 데이터 일관성, 카메라 모델 식별및 글꼴 균일성. 우리는 추가적인 위조 탐지 기술을 사용하여 이 게시물의 코드를 업데이트하는 것을 목표로 합니다.

ELA의 기본 전제는 입력 이미지가 손실 압축으로 알려진 JPEG 형식이라고 가정합니다. 그럼에도 불구하고 입력 이미지가 원래 무손실 형식(예: PNG, GIF 또는 BMP)이었다가 나중에 변조 프로세스 중에 JPEG로 변환된 경우에도 이 방법은 여전히 효과적일 수 있습니다. ELA를 원본 무손실 형식에 적용하면 일반적으로 품질 저하 없이 일관된 이미지 품질을 나타내기 때문에 변경된 영역을 정확히 찾아내기가 어렵습니다. JPEG 이미지에서 예상되는 표준은 전체 사진이 유사한 압축 수준을 나타내는 것입니다. 그러나 이미지 내의 특정 섹션에 현저하게 다른 오류 수준이 표시되면 디지털 변경이 이루어졌음을 의미하는 경우가 많습니다.

ELA는 JPEG 압축률의 차이를 강조합니다. 색상이 균일한 영역은 ELA 결과가 낮을 가능성이 높습니다(예: 고대비 가장자리에 비해 색상이 더 어두움). 변조 또는 수정을 식별하기 위해 찾아야 할 사항은 다음과 같습니다.

비슷한 가장자리는 ELA 결과에서 비슷한 밝기를 가져야 합니다. 모든 고대비 가장자리는 서로 유사해야 하며 모든 저대비 가장자리는 유사해야 합니다. 원본 사진의 경우 저대비 가장자리는 고대비 가장자리만큼 밝아야 합니다.
유사한 텍스처는 ELA에서 유사한 색상을 가져야 합니다. 농구공 클로즈업과 같이 표면 세부 묘사가 더 많은 영역은 매끄러운 표면보다 ELA 결과가 더 높을 수 있습니다.
표면의 실제 색상에 관계없이 모든 평평한 표면은 ELA에서 거의 동일한 색상을 가져야 합니다.

JPEG 이미지는 손실 압축 시스템을 사용합니다. 이미지를 다시 인코딩(재저장)할 때마다 이미지 품질이 더 많이 손실됩니다. 특히 JPEG 알고리즘은 8×8 픽셀 그리드에서 작동합니다. 각 8×8 정사각형은 독립적으로 압축됩니다. 이미지가 완전히 수정되지 않은 경우 모든 8×8 정사각형은 유사한 오류 가능성을 가져야 합니다. 이미지를 수정하지 않고 다시 저장하면 모든 사각형의 품질이 거의 같은 속도로 저하됩니다.

ELA는 지정된 JPEG 품질 수준으로 이미지를 저장합니다. 이렇게 다시 저장하면 전체 이미지에 알려진 양의 오류가 발생합니다. 그런 다음 다시 저장된 이미지를 원본 이미지와 비교합니다. 이미지가 수정된 경우 수정된 모든 8×8 정사각형은 이미지의 나머지 부분보다 오류 가능성이 더 높아야 합니다.

ELA의 결과는 이미지 품질에 직접적으로 영향을 받습니다. 무언가 추가되었는지 알고 싶을 수도 있지만 사진이 여러 번 복사된 경우 ELA는 재저장된 항목 감지만 허용할 수 있습니다. 사진의 최고 품질 버전을 찾아보세요.

교육과 실습을 통해 ELA는 이미지 크기 조정, 품질, 자르기 및 변형 다시 저장을 식별하는 방법도 배울 수 있습니다. 예를 들어, JPEG가 아닌 이미지에 눈에 보이는 격자선(1×8 정사각형의 너비 8픽셀)이 포함되어 있는 경우 이는 사진이 JPEG로 시작하여 JPEG가 아닌 형식(예: PNG)으로 변환되었음을 의미합니다. 그림의 일부 영역에 격자선이 없거나 격자선이 이동하는 경우 이는 JPEG가 아닌 이미지에서 스플라이스 또는 그려진 부분을 나타냅니다.

다음 섹션에서는 컴퓨터 비전 모델을 구성, 교육 및 배포하는 단계를 보여줍니다.

사전 조건

이 게시물을 따라하려면 다음 전제 조건을 완료하십시오.

AWS 계정이 있습니다.
설정 아마존 세이지 메이커 스튜디오. 기본 사전 설정을 사용하여 SageMaker Studio를 신속하게 시작하여 빠른 실행을 촉진할 수 있습니다. 자세한 내용은 다음을 참조하세요. Amazon SageMaker는 개별 사용자를 위한 Amazon SageMaker Studio 설정을 단순화합니다..
SageMaker Studio를 열고 시스템 터미널을 시작합니다.
터미널에서 다음 명령을 실행합니다.
git clone https://github.com/aws-samples/document-tampering-detection.git
한 명의 사용자가 SageMaker Studio를 실행하고 노트북 환경을 구성하는 데 드는 총 비용은 시간당 $7.314 USD입니다.

모델 학습 노트북 설정

교육 노트북을 설정하려면 다음 단계를 완료하세요.

열기 tampering_detection_training.ipynb 문서 변조 감지 디렉터리의 파일입니다.
TensorFlow 2.6 Python 3.8 CPU 또는 GPU 최적화 이미지로 노트북 환경을 설정합니다.
GPU 최적화 인스턴스를 선택할 때 가용성 부족 문제가 발생하거나 AWS 계정 내 GPU 인스턴스 할당량 제한에 도달할 수 있습니다. 할당량을 늘리려면 Service Quotas 콘솔을 방문하여 필요한 특정 인스턴스 유형에 대한 서비스 제한을 늘리십시오. 이러한 경우에는 CPU 최적화 노트북 환경을 사용할 수도 있습니다.
럭셔리 핵심선택한다. Python3.
럭셔리 인스턴스 유형선택한다. ml.m5d.24xlarge 또는 다른 대규모 인스턴스.

모델의 훈련 시간을 줄이기 위해 더 큰 인스턴스 유형을 선택했습니다. ml.m5d.24xlarge 노트북 환경의 경우 시간당 비용은 시간당 $7.258 USD입니다.

학습 노트북 실행

Notebook의 각 셀을 실행합니다. tampering_detection_training.ipynb 순서대로. 다음 섹션에서는 일부 셀에 대해 더 자세히 설명합니다.

원본 이미지와 변조된 이미지 목록이 포함된 데이터 세트 준비

노트북에서 다음 셀을 실행하기 전에 특정 비즈니스 요구 사항에 따라 원본 문서와 변조된 문서의 데이터 세트를 준비하세요. 이 게시물에서는 변조된 급여명세서와 은행 명세서의 샘플 데이터세트를 사용합니다. 데이터 세트는 이미지 디렉토리 내에서 사용할 수 있습니다. GitHub 저장소.

데이터 세트 준비

노트북은 원본 이미지와 변조된 이미지를 읽습니다. images/training 디렉토리.

교육용 데이터 세트는 이미지 파일 경로와 이미지 레이블(원본 이미지의 경우 0, 변조된 이미지의 경우 1)이라는 두 개의 열이 있는 CSV 파일을 사용하여 생성됩니다.

라벨 데이터 세트

각 훈련 이미지의 ELA 결과를 생성하여 데이터세트를 처리합니다.

이 단계에서는 입력 훈련 이미지의 ELA 결과(90% 품질)를 생성합니다. 함수 convert_to_ela_image 이미지 파일의 경로인 path와 JPEG 압축을 위한 품질 매개변수를 나타내는 quality라는 두 가지 매개변수를 사용합니다. 이 함수는 다음 단계를 수행합니다.

이미지를 RGB 형식으로 변환하고 이미지를 tempresaved.jpg라는 이름으로 지정된 품질의 JPEG 파일로 다시 저장합니다.
원본 이미지와 다시 저장된 JPEG 이미지(ELA) 간의 차이를 계산하여 원본 이미지와 다시 저장된 이미지 간의 픽셀 값의 최대 차이를 확인합니다.
ELA 이미지의 밝기를 조정하기 위해 최대 차이를 기준으로 배율을 계산합니다.
계산된 배율을 사용하여 ELA 이미지의 밝기를 향상시킵니다.
ELA 결과의 크기를 128x128x3으로 조정합니다. 여기서 3은 훈련을 위한 입력 크기를 줄이기 위한 채널 수를 나타냅니다.
ELA 이미지를 반환합니다.

JPEG와 같은 손실이 많은 이미지 형식에서는 초기 저장 과정에서 상당한 색상 손실이 발생합니다. 그러나 이미지가 로드된 후 동일한 손실 형식으로 다시 인코딩되면 일반적으로 색상 저하가 덜 추가됩니다. ELA 결과는 다시 저장할 때 색상이 저하되기 가장 쉬운 이미지 영역을 강조합니다. 일반적으로 변경 사항은 이미지의 나머지 부분에 비해 품질 저하 가능성이 더 높은 영역에서 두드러지게 나타납니다.

다음으로 이미지는 훈련을 위해 NumPy 배열로 처리됩니다. 그런 다음 입력 데이터 세트를 훈련, 테스트 또는 검증 데이터(80/20)로 무작위로 분할합니다. 이러한 셀을 실행할 때 경고를 무시할 수 있습니다.

교육을 위해 ELA로 전환

데이터 세트의 크기에 따라 이러한 셀을 실행하는 데 시간이 걸릴 수 있습니다. 이 리포지토리에 제공된 샘플 데이터세트의 경우 5~10분 정도 걸릴 수 있습니다.

CNN 모델 구성

이 단계에서는 작은 컨볼루셔널 필터를 사용하여 VGG 네트워크의 최소 버전을 구성합니다. VGG-16은 13개의 컨벌루션 레이어와 XNUMX개의 완전 연결 레이어로 구성됩니다. 다음 스크린샷은 CNN(Convolutional Neural Network) 모델의 아키텍처를 보여줍니다.

Tensorflow 모델 아키텍처

다음 구성에 유의하세요.

입력 – 모델은 128x128x3의 이미지 입력 크기를 사용합니다.
컨볼 루션 레이어 – 컨벌루션 레이어는 위/아래 및 왼쪽/오른쪽을 캡처하는 가능한 가장 작은 크기인 최소 수용 필드(3×3)를 사용합니다. 그 다음에는 훈련 시간을 줄이는 ReLU(Rectified Linear Unit) 활성화 함수가 나옵니다. 이는 양수인 경우 입력을 출력하는 선형 함수입니다. 그렇지 않으면 출력은 1입니다. 컨볼루션 스트라이드는 컨볼루션 이후 공간 해상도를 유지하기 위해 기본값(XNUMX픽셀)으로 고정됩니다(스트라이드는 입력 행렬에 대한 픽셀 이동 수입니다).
완전히 연결된 계층 – 네트워크에는 완전히 연결된 두 개의 레이어가 있습니다. 첫 번째 Dense 레이어는 ReLU 활성화를 사용하고, 두 번째 Dense 레이어는 Softmax를 사용하여 이미지를 원본 또는 변조된 것으로 분류합니다.

이러한 셀을 실행할 때 경고를 무시할 수 있습니다.

모델 아티팩트 저장

훈련된 모델을 고유한 파일 이름(예: 현재 날짜 및 시간 기준)으로 model이라는 디렉터리에 저장합니다.

텐서플로우 모델 아티팩트 저장

모델은 확장명을 사용하여 Keras 형식으로 저장됩니다. .keras. 또한 SageMaker 런타임에 배포하기 위한 변수 값 및 어휘를 포함하여 직렬화된 서명과 이를 실행하는 데 필요한 상태가 포함된 1이라는 디렉터리에 모델 아티팩트를 저장합니다(이 게시물의 뒷부분에서 설명).

모델 성능 측정

다음 손실 곡선은 훈련 시대(반복)에 따른 모델 손실의 진행을 보여줍니다.

모델 정확도 플롯

손실 함수는 모델의 예측이 실제 목표와 얼마나 잘 일치하는지 측정합니다. 값이 낮을수록 예측과 실제 값이 더 잘 정렬됨을 나타냅니다. 특정 시대에 걸쳐 손실이 감소한다는 것은 모델이 개선되고 있음을 의미합니다. 정확도 곡선은 학습 시대에 따른 모델의 정확도를 보여줍니다. 정확도는 전체 예측 수에 대한 올바른 예측의 비율입니다. 정확도가 높을수록 모델 성능이 더 우수함을 나타냅니다. 일반적으로 모델이 패턴을 학습하고 예측 능력을 향상시키면 훈련 중에 정확도가 높아집니다. 이를 통해 모델이 과적합(훈련 데이터에서는 성능이 좋지만 보이지 않는 데이터에서는 성능이 좋지 않음)인지 과소적합(훈련 데이터에서 충분히 학습하지 못함)인지 판단하는 데 도움이 됩니다.

다음 혼동 행렬은 모델이 포지티브(값 1로 표시되는 위조 이미지) 클래스와 네거티브(변경되지 않은 이미지, 값 0으로 표시) 클래스를 얼마나 정확하게 구별하는지 시각적으로 나타냅니다.

혼란 행렬 도표

모델 훈련 후 다음 단계는 컴퓨터 비전 모델을 API로 배포하는 것입니다. 이 API는 인수 작업 흐름의 구성 요소로 비즈니스 애플리케이션에 통합됩니다. 이를 달성하기 위해 우리는 완전관리형 서비스인 Amazon SageMaker Inference를 사용합니다. 이 서비스는 MLOps 도구와 원활하게 통합되어 확장 가능한 모델 배포, 비용 효율적인 추론, 프로덕션의 향상된 모델 관리 및 운영 복잡성 감소를 지원합니다. 이 게시물에서는 모델을 실시간 추론 엔드포인트로 배포합니다. 그러나 비즈니스 애플리케이션의 워크플로에 따라 모델 배포를 일괄 처리, 비동기 처리 또는 서버리스 배포 아키텍처를 통해 맞춤화할 수도 있다는 점에 유의하는 것이 중요합니다.

모델 배포 노트북 설정

모델 배포 노트북을 설정하려면 다음 단계를 완료하세요.

열기 tampering_detection_model_deploy.ipynb 문서 변조 감지 디렉터리의 파일입니다.
Data Science 3.0 이미지로 노트북 환경을 설정합니다.
럭셔리 핵심선택한다. Python3.
럭셔리 인스턴스 유형선택한다. ml.t3. 매체.

ml.t3.medium 노트북 환경의 경우 시간당 비용은 $0.056 USD입니다.

모든 Amazon S3 작업을 허용하도록 SageMaker 역할에 대한 사용자 지정 인라인 정책을 생성합니다.

XNUMXD덴탈의 AWS 자격 증명 및 액세스 관리 (IAM) SageMaker 역할은 다음 형식을 따릅니다. AmazonSageMaker- ExecutionRole-<random numbers>. 올바른 역할을 사용하고 있는지 확인하세요. 역할 이름은 SageMaker 도메인 구성 내의 사용자 세부 정보에서 찾을 수 있습니다.

모든 것을 허용하는 인라인 정책을 포함하도록 IAM 역할을 업데이트합니다. 아마존 단순 스토리지 서비스 (Amazon S3) 작업. 이는 모델 아티팩트를 저장할 S3 버킷의 생성 및 삭제를 자동화하는 데 필요합니다. 특정 S3 버킷에 대한 액세스를 제한할 수 있습니다. IAM 정책에서 S3 버킷 이름에 와일드카드를 사용했습니다(tamperingdetection*).

배포 노트북 실행

Notebook의 각 셀을 실행합니다. tampering_detection_model_deploy.ipynb 순서대로. 다음 섹션에서는 일부 셀에 대해 더 자세히 설명합니다.

S3 버킷 생성

셀을 실행하여 S3 버킷을 생성합니다. 버킷 이름이 지정됩니다. tamperingdetection<current date time> SageMaker Studio 환경과 동일한 AWS 리전에 있습니다.

Amazon S3 버킷 생성

모델 아티팩트 아카이브를 생성하고 Amazon S3에 업로드

모델 아티팩트에서 tar.gz 파일을 만듭니다. SageMaker 런타임에 배포할 변수 값과 어휘를 포함하여 직렬화된 서명과 이를 실행하는 데 필요한 상태가 포함된 모델 아티팩트를 1이라는 디렉터리에 저장했습니다. 다음과 같은 사용자 정의 추론 파일을 포함할 수도 있습니다. inference.py 모델 아티팩트의 코드 폴더 내. 사용자 지정 추론은 입력 이미지의 전처리 및 후처리에 사용될 수 있습니다.

Amazon S3에 모델 아티팩트 업로드

SageMaker 추론 엔드포인트 생성

SageMaker 추론 엔드포인트를 생성하는 셀을 완료하는 데 몇 분 정도 걸릴 수 있습니다.

Amazon SageMaker 추론 엔드포인트 생성

추론 엔드포인트 테스트

기능 check_image 이미지를 ELA 이미지로 전처리하고, 추론을 위해 SageMaker 엔드포인트로 보내고, 모델의 예측을 검색 및 처리하고, 결과를 인쇄합니다. 모델은 입력 이미지의 NumPy 배열을 ELA 이미지로 사용하여 예측을 제공합니다. 예측은 변조되지 않은 이미지를 나타내는 0과 위조된 이미지를 나타내는 1로 출력됩니다.

Amazon SageMaker 추론 엔드포인트 테스트

조작되지 않은 급여명세서 이미지로 모델을 호출하고 결과를 확인해 보겠습니다.

원본 이미지 테스트

모델은 분류를 0으로 출력하여 변조되지 않은 이미지를 나타냅니다.

이제 변조된 급여 명세서 이미지로 모델을 호출하고 결과를 확인해 보겠습니다.

위조된 이미지 테스트

모델은 분류를 1로 출력하여 위조된 이미지를 나타냅니다.

제한 사항

ELA는 수정 사항을 감지하는 데 도움이 되는 훌륭한 도구이지만 다음과 같은 여러 가지 제한 사항이 있습니다.

JPEG는 그리드에서 작동하기 때문에 단일 픽셀 변경이나 사소한 색상 조정은 ELA에서 눈에 띄는 변화를 생성하지 않을 수 있습니다.
ELA는 압축 수준이 다른 지역만 식별합니다. 낮은 품질의 이미지가 높은 품질의 사진에 결합되면 낮은 품질의 이미지가 더 어두운 영역으로 나타날 수 있습니다.
이미지의 크기를 조정하거나 다시 칠하거나 노이즈를 추가하면 전체 이미지가 수정되어 오류 수준이 높아질 가능성이 높아집니다.
이미지를 여러 번 다시 저장하면 완전히 오류 수준이 최소화될 수 있으며 더 많이 다시 저장해도 이미지가 변경되지 않습니다. 이 경우 ELA는 검은색 이미지를 반환하며 이 알고리즘을 사용하여 수정 사항을 식별할 수 없습니다.
Photoshop을 사용하면 사진을 저장하는 간단한 작업으로 텍스처와 가장자리가 자동으로 선명해져서 오류 수준이 높아질 가능성이 높아집니다. 이 아티팩트는 의도적인 수정을 식별하지 않습니다. Adobe 제품이 사용되었음을 식별합니다. 기술적으로 ELA는 Adobe가 자동으로 수정을 수행했지만 수정이 반드시 사용자에 의해 의도된 것은 아니기 때문에 수정으로 나타납니다.

더 광범위한 이미지 조작 사례를 감지하려면 이전에 블로그에서 논의한 다른 기술과 함께 ELA를 사용하는 것이 좋습니다. ELA는 특히 CNN 기반 모델 교육이 어려울 때 이미지 차이를 시각적으로 검사하기 위한 독립적인 도구 역할을 할 수도 있습니다.

정리

이 솔루션의 일부로 생성한 리소스를 제거하려면 다음 단계를 완료하세요.

아래에서 노트북 셀을 실행합니다. 대청소 부분. 이렇게 하면 다음이 삭제됩니다.
1. SageMaker 추론 엔드포인트 – 추론 끝점 이름은 다음과 같습니다. tamperingdetection-<datetime>.
2. S3 버킷 및 S3 버킷 자체 내의 객체 – 버킷 이름은 다음과 같습니다. tamperingdetection<datetime>.
종료 SageMaker Studio 노트북 리소스.

결론

이 게시물에서는 딥 러닝과 SageMaker를 사용하여 문서 변조 및 사기를 탐지하는 엔드투엔드 솔루션을 제시했습니다. 우리는 ELA를 사용하여 이미지를 전처리하고 조작을 나타낼 수 있는 압축 수준의 불일치를 식별했습니다. 그런 다음 이 처리된 데이터세트에 대해 CNN 모델을 훈련하여 이미지를 원본 또는 변조된 것으로 분류했습니다.

이 모델은 비즈니스 요구 사항에 적합한 데이터 세트(위조 및 원본)를 사용하여 95% 이상의 정확도로 강력한 성능을 달성할 수 있습니다. 이는 급여 명세서 및 은행 명세서와 같은 위조 문서를 안정적으로 탐지할 수 있음을 나타냅니다. 훈련된 모델은 SageMaker 엔드포인트에 배포되어 대규모로 지연 시간이 짧은 추론을 활성화합니다. 이 솔루션을 모기지 워크플로우에 통합함으로써 기관은 추가 사기 조사를 위해 의심스러운 문서에 자동으로 플래그를 지정할 수 있습니다.

ELA는 강력하기는 하지만 특정 유형의 보다 미묘한 조작을 식별하는 데에는 몇 가지 제한 사항이 있습니다. 다음 단계에서는 추가 포렌식 기술을 교육에 통합하고 더 크고 다양한 데이터 세트를 사용하여 모델을 향상할 수 있습니다. 전반적으로 이 솔루션은 딥 러닝과 AWS 서비스를 사용하여 효율성을 높이고 위험을 줄이며 사기를 방지하는 영향력 있는 솔루션을 구축할 수 있는 방법을 보여줍니다.

3부에서는 Amazon Fraud Detector에서 솔루션을 구현하는 방법을 보여줍니다.

저자 소개

아눕 라빈드라나트 캐나다 토론토에 본사를 둔 AWS(Amazon Web Services)의 선임 솔루션 설계자로 금융 서비스 조직과 협력하고 있습니다. 그는 고객이 비즈니스를 혁신하고 클라우드에서 혁신하도록 돕습니다.

비니 사이니 캐나다 토론토에 본사를 둔 Amazon Web Services(AWS)의 선임 솔루션 아키텍트입니다. 그녀는 Architectural Excellence의 강력한 기본 기둥에 놓인 AI 및 ML 기반 솔루션을 통해 금융 서비스 고객이 클라우드에서 혁신하도록 돕고 있습니다.

SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
출처: https://aws.amazon.com/blogs/machine-learning/train-and-host-a-computer-vision-model-for-tampering-detection-on-amazon-sagemaker-part-2/

타임 스탬프 : 2024 년 1 월 31 일

타임 스탬프 : 8년 2023월 XNUMX일