Amazon Comprehend menyediakan pemrosesan bahasa alami, deteksi dan redaksi Informasi Pengenal Pribadi (PII), deteksi Klasifikasi Kustom dan Entitas, dan pemodelan topik,memungkinkan rentang luas aplikasi yang dapat menganalisis teks mentah, dan dengan beberapa API, format dokumen seperti PDF dan Word.
- Pemrosesan Bahasa Alami: API Amazon Comprehend untuk pengenalan entitas, analisis sentimen, analisis sintaksis, ekstraksi frasa kunci, dan deteksi bahasa dapat digunakan untuk mengekstraksi wawasan dari teks bahasa alami. Permintaan tersebut diukur dalam satuan 100 karakter (1 unit = 100 karakter), dengan biaya minimum 3 unit (300 karakter) per permintaan.
- Informasi Pengenal Pribadi (PII): Deteksi API PII menemukan lokasi entitas Informasi Pengenal Pribadi ("PII") yang dipilih di dalam dokumen dan dapat digunakan untuk membuat versi dokumen yang disunting. Isi API PII memberi tahu Anda jika suatu dokumen berisi PII yang dipilih atau tidak. Permintaan ini juga diukur dalam satuan 100 karakter (1 unit = 100 karakter), dengan biaya minimum 3 unit (300 karakter) per permintaan.
- Custom Comprehend: Klasifikasi Kustom dan API Entitas dapat melatih model NLP kustom untuk mengategorikan teks dan mengekstrak entitas kustom. Permintaan inferensi asinkron diukur dalam unit 100 karakter, dengan biaya minimum 3 unit (300 karakter) per permintaan. Anda dikenai biaya sebesar 3 USD per jam untuk pelatihan model (ditagihkan berdasarkan detik) dan 0,50 USD per bulan untuk manajemen model kustom. Untuk permintaan inferensi Klasifikasi dan Entitas Kustom, Anda menyediakan titik akhir dengan throughput yang sesuai. Anda dikenai biaya sejak titik akhir dimulai hingga titik akhir dihapus.
- Pemodelan Topik: Pemodelan Topik mengidentifikasi istilah atau topik relevan dari sekumpulan dokumen yang disimpan di Amazon S3. Kemampuan ini akan mengidentifikasi topik paling umum dalam kumpulan dan mengelolanya dalam grup, kemudian memetakan kecocokan antara dokumen dan topik. Anda dikenai biaya berdasarkan total ukuran dokumen yang diproses per tugas. 100 MB pertama dikenai tarif rata. Di atas 100 MB, Anda akan dikenai biaya per MB.
- Kepercayaan dan Keamanan (baru): API deteksi toksisitas Comprehend dapat digunakan untuk mendeteksi konten toksik dari teks. Demikian pula, fitur klasifikasi keamanan prompt Comprehend dapat digunakan untuk mendeteksi prompt input yang tidak aman ke model dan aplikasi bahasa besar. Permintaan tersebut diukur dalam satuan 100 karakter (1 unit = 100 karakter), dengan biaya minimum 3 unit (300 karakter) per permintaan.
- Untuk harga Amazon Comprehend Medical, pelajari selengkapnya di sini.
- Anda dapat memperkirakan biaya Anda menggunakan Kalkulator Harga AWS.
- Pilih wilayah AS Timur (Virginia Utara) di pemilih wilayah di bawah ini untuk melihat harga untuk semua API
Dengan API Amazon Comprehend, Anda dapat memproses teks mentah yang tidak terstruktur dan, dengan beberapa API, file teks lain seperti dokumen PDF dan Word.
Permintaan inferensi diukur dalam unit 100 karakter, dengan biaya minimum 3 unit (300 karakter) per permintaan.
Permintaan inferensi diukur dalam unit 100 karakter, dengan biaya minimum 3 unit (300 karakter) per permintaan.
Titik akhir ditagih dengan kenaikan satu detik, dengan minimum 60 detik. Anda akan terus dikenai biaya sejak titik akhir dimulai hingga titik akhir dihapus, meski tidak ada dokumen yang dianalisis.
Satu unit inferensi (IU) menyediakan throughput 100 karakter/detik pada titik akhir yang dikelola milik Anda. Anda dapat menyediakan IU tambahan untuk memperbanyak throughput. Tiap IU akan dikenai biaya sebesar 0,0005 USD per detik.
*untuk mengekstraksi teks dari dokumen PDF yang dipindai API Teks Dokumen Deteksi Amazon Textract dipanggil.
Untuk 100 MB pertama
Untuk setiap MB di atas 100 MB
Anda dikenai biaya berdasarkan total ukuran dokumen yang diproses per tugas pemodelan topik. 100 MB pertama dikenai tarif rata. Di atas 100 MB, Anda akan dikenai biaya per MB.
Amazon Comprehend menawarkan tingkat gratis yang mencakup 50 ribu unit teks (5 juta karakter) per API per bulan.
API yang memenuhi syarat mencakup Ekstraksi Frasa Kunci, Sentimen, Sentimen Bertarget, Pengenalan Entitas, Deteksi Bahasa, Deteksi Peristiwa, Analisis Sintaksis, Deteksi PII, Berisi PII, dan Klasifikasi Keamanan Prompt.
Catatan: Comprehend Kustom (entitas kustom dan klasifikasi kustom) tidak menawarkan tingkat gratis. Ini termasuk pelatihan model, inferensi, dan manajemen model.
Tingkat gratis Amazon Comprehend tersedia untuk pelanggan AWS baru dan yang sudah ada selama 12 bulan, mulai dari tanggal permintaan Amazon Comprehend pertama mereka.
Contoh harga Amazon Comprehend
Contoh 1 - Menganalisis komentar pelanggan
Kami menganggap Anda telah membuat aplikasi menggunakan Amazon Comprehend untuk menganalisis komentar pelanggan di penyimpanan online Anda. Anda telah menerima 10.000 komentar pelanggan yang masing-masing merupakan 550 karakter, dan Anda dalam tahun kedua menggunakan layanan ini.
Penghitungan biaya total:
Ukuran tiap permintaan = 550 karakter
Jumlah unit per permintaan = 6
Total Unit: 10.000 (permintaan) x 6 (unit per permintaan) = 60.000
Harga per unit = 0,0001 USD
Total biaya = [No. unit] x [Biaya per unit] = 60.000 x 0,0001 USD = 6,00 USD
Contoh 2 - Mengategorikan dokumen berdasarkan topik
Anggaplah Anda memiliki serangkaian dokumen riset dengan total 240 MB dalam ukuran yang Anda inginkan untuk pengkategorian berdasarkan topik dan menyarankan dokumen kepada pelanggan berdasarkan bidang minat mereka. Anggap juga Anda berada di tahun kedua menggunakan layanan dan tidak memenuhi syarat untuk penawaran tingkat gratis.
Penghitungan biaya total:
Total megabyte yang diproses = 240
Megabyte yang ditagih pada tarif rata 1 USD = 100
Megabyte yang ditagih pada 0,004 USD/MB = 140 [240-100]
Total biaya tugas = 1,00 USD + [140 x 0,004 USD] = 1,00 USD + 0,56 USD = 1,56 USD
Contoh 3 - Mengklasifikasikan umpan balik pelanggan menggunakan API klasifikasi kustom
Anggaplah Anda ingin melatih pengklasifikasi untuk secara otomatis menyusun umpan balik pelanggan baru yang hadir dari situs web Anda. 10 pelanggan memasukkan umpan balik setiap menit, dan tiap umpan balik terdiri dari 300 karakter. Melatih model kustom memerlukan waktu selama satu jam, dan Anda berencana menyimpan model ini selama satu bulan. Jadi, biaya pelatihan model adalah 3 USD dan biaya penyimpanan model adalah 0,5 USD untuk bulan tersebut. Anggap juga Anda berada di tahun kedua menggunakan layanan dan tidak memenuhi syarat untuk penawaran tingkat gratis.
Untuk mengklasifikasi umpan balik secara asinkron, Anda dikenai biaya berdasarkan jumlah karakter dalam dokumen. Untuk mengklasifikasi secara real-time, Anda menyediakan titik akhir dengan throughput yang sesuai guna menangani kasus penggunaan dan membayar berdasarkan waktu dimulainya titik akhir.
Penghitungan biaya inferensi untuk klasifikasi asinkron:
Ukuran tiap permintaan per hari = 4.320.000 karakter [300 karakter * 10 dokumen * 1.440 menit]
Jumlah unit per permintaan = 43.200 unit [432.000 karakter ÷ 100 karakter per unit]
Harga per unit = 0,0005 USD
Total biaya inferensi untuk unit = 21,60 USD [43.200 unit x 0,0005 USD]
Total biaya = 25,10 USD [21,60 USD inferensi + 3 USD pelatihan model + 0,50 USD penyimpanan model]
Penghitungan biaya total untuk klasifikasi sinkron:
Pertama, mari hitung throughput yang diperlukan. Setiap menit kita mengklasifikasi 10 dokumen yang masing-masing terdiri dari 300 karakter. Jadi:
50 karakter per detik [300 karakter x 10 dokumen ÷ 60 detik]
Artinya Anda perlu menyediakan titik akhir dengan 1 Unit Inferensi (IU), yang memberikan throughput 100 karakter/detik.
Harga untuk 1 IU = 0,0005 USD per detik
Anda akan dikenai biaya berdasarkan seberapa lama Anda membuat titik akhir klasifikasi real-time tetap aktif, terlepas dari jumlah panggilan inferensi yang dibuat.
Jika Anda menjalankan titik akhir klasifikasi real-time selama 12 jam per hari:
Total biaya inferensi = 21,60 USD [0,0005 USD x 3600 detik x 12 jam]
Total biaya = 25,10 USD [21,60 USD inferensi + 3 USD pelatihan model + 0,50 USD penyimpanan model]
Perhatikan bahwa Anda dikenai biaya untuk throughput yang disediakan dan jumlah waktu aktif titik akhir. Jika Anda perlu menyediakan lebih banyak throughput, harganya menjadi:
Harga untuk 2 IU = 0,001 USD per detik [0,0005 USD x 2]
Harga untuk 3 IU = 0,0015 USD per detik [0,0005 USD x 3]
Contoh 4 - Menganalisis komentar pelanggan menggunakan API entitas kustom
Penghitungan biaya total:
Ukuran tiap permintaan = 5.500.000 karakter
Jumlah unit per permintaan = 55.000 unit [5.500.000 karakter ÷ 100 karakter per unit]
Harga per unit = 0,0005 USD
Total biaya untuk unit = 27,5 USD [55.000 unit x 0,0005 USD]
Total jam untuk pelatihan model = 1,5 jam
Harga per jam = 3 USD
Total biaya untuk pelatihan model = 4,5 USD [1,5 jam x 3 USD]
Jumlah bulan untuk manajemen model = 1 bulan
Harga per bulan = 0,50 USD
Total biaya untuk manajemen model = 0,50 USD [1 bulan x 0,50 USD]
Biaya total = 37 USD [27,5 USD + 4,5 USD + 0,50 USD]
Contoh 5 - Mengekstraksi kejadian dan informasi terkait menggunakan deteksi kejadian
Penghitungan biaya total:
Jumlah karakter yang diproses = 1,500,000 karakter [3.000 artikel x 500 karakter]
Jumlah unit yang diproses = 45.000 unit [1.500.000 x 3 jenis kejadian ÷ 100 karakter per unit]
Harga per unit = 0,003 USD
Biaya total untuk unit = 135 USD [45.000 unit x 0,003 USD]
Contoh 6 - Mengidentifikasi dokumen dengan PII menggunakan API berisi PII
Penghitungan biaya total:
Ukuran tiap permintaan = 550 karakter
Jumlah unit per permintaan = 6
Total Unit = 60.000 [10.000 permintaan x 6 unit per permintaan]
Harga per unit = 0,000002 USD
Biaya total = 0,12 USD [60.000 unit x 0,000002 USD]
Contoh 7 - Menyunting PII dari dokumen menggunakan API deteksi PII
Penghitungan biaya total:
Ukuran tiap permintaan = 550 karakter
Jumlah unit per permintaan = 6
Total Unit = 60.000 [10.000 permintaan x 6 unit per permintaan]
Harga per unit = 0,0001 USD
Biaya total = 6 USD [60.000 unit x 0,0001 USD]
Contoh 8 – Mengekstraksi entitas aplikasi hipotek menggunakan API entitas kustom
Penghitungan biaya inferensi untuk klasifikasi asinkron:
Ukuran setiap permintaan per hari = 2.500.000 karakter [100 aplikasi/hari * 10 dokumen * 2.500 karakter]
Jumlah unit per permintaan = 25.000 unit [2.500.000 karakter ÷ 100 karakter per unit]
Harga per unit = 0,0005 USD
Total biaya inferensi untuk unit = 12,50 USD [25.000 unit x 0,0005 USD]
Biaya Amazon Textract untuk API Teks Dokumen Deteksi= 1,50 USD [100 aplikasi/hari * 10 dokumen * 0,0015 USD harga per halaman, hingga 1 juta halaman]
Total biaya = 17,50 USD [12,50 USD inferensi + 1,50 USD Textract + 3 USD pelatihan model + 0,50 USD penyimpanan model]
Contoh 9 – Menganalisis tanggapan survei karyawan
Perhitungan biaya total:
Ukuran tiap permintaan = 350 karakter
Jumlah unit per permintaan = 4
Total Unit = 100.000 (permintaan) x 4 (unit per permintaan) = 400.000
Harga per unit = 0,0001 USD (dari 0-10M unit)
Total biaya = [Jumlah unit] x [Biaya per unit] = 400.000 x 0,0001 USD = 40,00 USD
Contoh 10 - Mendeteksi toksisitas dalam komentar online di situs web
Penghitungan biaya total:
Ukuran tiap permintaan = 100 karakter
Jumlah unit per permintaan = 1 Total
Unit = 100 juta IU [100 juta komentar x 1 unit per permintaan]
Harga per unit = 0,0001 USD [dari 0 - 10 juta IU] + 0,00005 USD [dari 10 juta - 50 juta IU] + 0,000025 USD [dari 50 juta – 100 juta IU]
Total biaya = [Jumlah unit] x [Biaya per unit]
= [10juta X 0,001 USD]+[40 juta X 0,00005 USD]+[50 juta X 0,000025 USD]
= 1.000 USD + 2.000 USD + 1.250 USD
= 4.250 USD
Contoh 11 - Mendeteksi prompt yang tidak aman dalam aplikasi AI generatif
Penghitungan biaya total:
Ukuran tiap permintaan = 500 karakter
Jumlah unit per permintaan = 5
Total Unit = 50 juta IU [10 juta komentar x 5 unit per permintaan]
Harga per unit = 0,0001 USD [dari 0 - 10 juta IU] + 0,00005 USD [dari 10 juta - 50 juta IU] + 0,000025 USD [dari 50 juta – 100 juta IU]
Total biaya = [Jumlah unit] x [Biaya per unit]
= [10 juta X 0,001 USD] + [40 juta X 0,00005 USD]
= 1.000 USD + 2.000 USD
= 3.000 USD
Pelajari selengkapnya tentang fitur Amazon Comprehend