- Phân tích›
- AWS Clean Rooms›
- Câu hỏi thường gặp
Câu hỏi thường gặp về AWS Clean Rooms
Thông tin chung
AWS Clean Rooms là gì?
AWS Clean Rooms giúp bạn và đối tác của bạn phân tích cũng như cộng tác để khai thác tập dữ liệu chung của bạn một cách dễ dàng hơn, nhằm thu thập thông tin chuyên sâu mới mà không cần tiết lộ dữ liệu cơ bản cho bên còn lại. Bạn có thể tạo phòng sạch của riêng mình chỉ trong vài phút, sau đó bắt đầu phân tích tập dữ liệu chung với đối tác chỉ với vài bước thao tác. Với AWS Clean Rooms, bạn có thể dễ dàng cộng tác với bất kỳ công ty nào trong AWS và Snowflake mà không cần bất kỳ bên nào phải di chuyển, tiết lộ hoặc sao chép tập dữ liệu cơ bản của họ.
Phiên cộng tác trong AWS Clean Rooms là gì?
Phiên cộng tác AWS Clean Rooms là ranh giới logic an toàn cho phép các thành viên cộng tác chạy các truy vấn SQL và thực hiện mô hình máy học mà không cần chia sẻ dữ liệu thô với đối tác của họ. Chỉ những công ty đã được mời cộng tác mới có thể tham gia cộng tác. Nhiều người tham gia có thể đóng góp dữ liệu vào một phiên cộng tác và một thành viên có thể nhận kết quả. Chỉ các công ty được mời mới có thể tham gia một phiên cộng tác trong AWS Clean Rooms.
AWS Clean Rooms có những loại kỹ thuật phân tích nào?
Từ Bảng điều khiển quản lý AWS, bạn có thể chọn loại phân tích bạn muốn thực hiện, đối tác bạn muốn cộng tác và tập dữ liệu bạn muốn đóng góp cho phiên cộng tác. Với AWS Clean Rooms, bạn có thể thực hiện hai loại phân tích, truy vấn SQL và máy học.
Khi bạn chạy truy vấn SQL hoặc Spark SQL, AWS Clean Rooms sẽ đọc dữ liệu tại chỗ và áp dụng các quy tắc phân tích linh hoạt, tích hợp sẵn để giúp bạn tiếp tục kiểm soát dữ liệu của mình. AWS Clean Rooms cung cấp một loạt các biện pháp kiểm soát SQL tăng cường quyền riêng tư – bao gồm biện pháp kiểm soát truy vấn, các hạn chế đối với đầu ra của truy vấn và tạo bản ghi truy vấn – qua đó cho phép bạn tùy chỉnh các hạn chế đối với các truy vấn do từng người tham gia phòng sạch tiến hành chạy. Bạn có thể sử dụng công cụ phân tích Spark để chạy truy vấn bằng phương ngữ Spark SQL trong hoạt động cộng tác AWS Clean Rooms. Spark SQL của AWS Clean Rooms cung cấp các kích thước điện toán có thể cấu hình để nâng cao tính linh hoạt trong việc tùy chỉnh và phân bổ tài nguyên để chạy các truy vấn SQL dựa trên yêu cầu về hiệu năng, quy mô và chi phí của bạn. Spark SQL của AWS Clean Rooms chỉ hỗ trợ quy tắc phân tích tùy chỉnh. Quyền riêng tư khác biệt của AWS Clean Rooms giúp bạn bảo vệ quyền riêng tư của người dùng bằng các biện pháp kiểm soát trực quan và được hỗ trợ về mặt toán học chỉ trong vài cú nhấp chuột. Với công cụ phân tích SQL, bạn có thể sử dụng Quyền riêng tư khác biệt của AWS Clean Rooms bằng cách chọn quy tắc phân tích tùy chỉnh SQL, rồi định cấu hình các tham số cho quyền riêng tư khác biệt theo ý muốn. Ngoài ra, Điện toán mã cho Clean Rooms (C3R) giúp bạn mã hóa dữ liệu nhạy cảm trong quá trình phân tích SQL khi sử dụng công cụ phân tích Spark hoặc công cụ phân tích SQL để chạy truy vấn. Để áp dụng Quyền riêng tư khác biệt của AWS Clean Rooms hoặc sử dụng các quy tắc phân tích danh sách hoặc tổng hợp trong quá trình cộng tác, bạn phải dùng SQL làm công cụ phân tích.
AWS Clean Rooms ML giúp bạn và đối tác áp dụng máy học (ML) tăng cường quyền riêng tư để tạo thông tin chuyên sâu dự đoán mà không cần phải chia sẻ dữ liệu thô với nhau. AWS Clean Rooms ML hỗ trợ tính năng lập mô hình máy học (ML) tùy chỉnh và tương tự. Với tính năng lập mô hình tùy chỉnh, bạn có thể đưa vào một mô hình tùy chỉnh để đào tạo và chạy suy luận trên các tập dữ liệu chung mà không cần chia sẻ dữ liệu cơ sở hoặc sở hữu trí tuệ giữa các cộng tác viên. Với tính năng lập mô hình tương tự, bạn có thể sử dụng mô hình do AWS tạo ra để tạo một tập hợp mở rộng gồm bản ghi tương tự, dựa trên một mẫu nhỏ gồm các bản ghi mà đối tác của bạn đưa vào quá trình cộng tác.
Tính năng lập mô hình tương tự của AWS Clean Rooms ML, sử dụng mô hình do AWS tạo ra, được xây dựng và kiểm thử trên rất nhiều tập dữ liệu khác nhau như thương mại điện tử và phát trực tuyến video, dịch vụ này có thể giúp khách hàng cải thiện độ chính xác của mô hình tương tự lên đến 36%, khi so sánh với mức cơ sở đại diện trong ngành. Trong trường hợp áp dụng thực tế như tìm kiếm khách hàng mới, mức cải thiện độ chính xác này có thể tiết kiệm hàng triệu đô la.
Làm thế nào để bắt đầu sử dụng AWS Clean Rooms?
Bằng cách sử dụng Bảng điều khiển quản lý AWS hoặc các thao tác API, bạn sẽ tạo một phiên cộng tác trong phòng sạch, mời các công ty mà bạn muốn cộng tác, và chọn khả năng của mỗi người tham gia cộng tác trong phiên cộng tác. Sau đó, người tham gia có thể thiết lập các quy tắc về cách dữ liệu có cấu trúc có thể được truy vấn và đào tạo các mô hình ML trên dữ liệu của họ. Tập dữ liệu không được sao chép từ tài khoản của người tham gia và chỉ được truy cập khi cần thiết. Với AWS Clean Rooms, bạn có thể chọn loại phân tích bạn muốn thực hiện: Truy vấn SQL và lập mô hình ML bằng Công nghệ AWS Clean Rooms ML. Khi sử dụng truy vấn SQL, bạn cũng sử dụng thêm các tính năng khác như trình tạo phân tích không cần viết mã, Quyền riêng tư khác biệt của AWS Clean Rooms và điện toán mã hóa. Sau khi những người tham gia cộng tác đã liên kết dữ liệu hoặc mô hình với một phiên cộng tác và các phân tích đã được chạy, kết quả cộng tác sẽ được lưu trữ trong vùng lưu trữ Dịch vụ lưu trữ đơn giản của Amazon (Amazon S3) được chỉ định.
Tôi có thể sử dụng loại nguồn dữ liệu nào trong AWS Clean Rooms?
AWS Clean Rooms có thể sử dụng dữ liệu từ Amazon S3, Amazon Athena hoặc Snowflake mà không cần phải di chuyển, tiết lộ hoặc sao chép tập dữ liệu cơ bản của bạn. AWS Clean Rooms đọc dữ liệu từ nguồn tại thời điểm truy vấn được chạy, tránh sự phức tạp và chi phí sao chép tập dữ liệu sang một môi trường riêng biệt. Tìm hiểu thêm về hỗ trợ AWS Clean Rooms cho nhiều đám mây và nguồn dữ liệu tại đây.
Có thể có bao nhiêu thành viên trong một phiên cộng tác?
AWS Clean Rooms hỗ trợ tối đa năm người tham gia cho mỗi phiên cộng tác.
Ai xác định đối tượng có quyền truy cập phiên cộng tác trong AWS Clean Rooms?
Bạn nắm quyền kiểm soát đối tượng có thể tham gia phiên cộng tác trong AWS Clean Rooms của mình và bạn có thể tạo phiên cộng tác hoặc tham gia cộng tác qua lời mời. Quá trình tham gia sẽ minh bạch đối với từng bên trong một phiên cộng tác và không thể thêm tài khoản mới sau khi tạo phiên cộng tác. Tuy nhiên, bạn có thể thiết lập các phiên cộng tác mới với những khách hàng hoặc đối tác khác nhau nếu cần. Bạn thiết lập và quản lý quyền truy cập vào nội dung của mình và bạn cũng có thể thiết lập quyền truy cập vào các dịch vụ và tài nguyên của AWS thông qua người dùng, nhóm, quyền và thông tin chứng thực mà bạn kiểm soát.
Ai có thể thu thập thông tin chuyên sâu từ một phiên cộng tác trong AWS Clean Rooms?
Khách hàng có thể tạo thông tin chuyên sâu bằng cách sử dụng SQL hoặc AWS Clean Rooms ML trên tập dữ liệu chung với đối tác của họ – mà không cần chia sẻ hoặc tiết lộ dữ liệu cơ bản.
Với SQL, nhiều cộng tác viên có thể đóng góp dữ liệu, tuy nhiên chỉ một cộng tác viên có thể chạy truy vấn SQL và nhận kết quả. Khi tham gia cộng tác, các cộng tác viên sẽ thống nhất bên nào sẽ chạy các truy vấn, bên nào sẽ nhận được kết quả và bên nào sẽ chịu trách nhiệm về phí tính toán. Chỉ những người bạn mời tham gia phiên hợp tác đó mới có thể có được thông tin chuyên sâu dựa trên các quy tắc phân tích mà bạn thiết lập. Khi thiết lập phiên cộng tác AWS Clean Rooms, bạn có thể chỉ định các khả năng khác nhau cho từng thành viên cộng tác để phù hợp với các trường hợp sử dụng cụ thể của bạn. Ví dụ: nếu bạn muốn đầu ra truy vấn chuyển đến một thành viên khác, bạn có thể chỉ định một thành viên làm người chạy truy vấn có thể viết truy vấn và một thành viên khác làm người nhận kết quả truy vấn có thể nhận kết quả. Như vậy, người tạo phiên cộng tác có khả năng đảm bảo rằng thành viên có khả năng truy vấn sẽ không có quyền truy cập vào kết quả truy vấn.
Với công nghệ máy học AWS Clean Rooms, cộng tác viên mang đến tập hợp hồ sơ mẫu để tìm phân đoạn tương tự từ đối tác; bên kia có quần thể lớn hơn để chúng tôi tạo ra các phân đoạn giống nhau dựa trên sự tương đồng của chúng với bản ghi mẫu. Công nghệ máy học AWS Clean Rooms sẽ gửi kết quả phân đoạn tương tự đến một đích đến được chỉ định bởi bên có quần thể lớn hơn mà chúng tôi lấy các phân đoạn tương tự.
AWS Clean Rooms có cung cấp tính năng giải pháp thực thể để so khớp dữ liệu của mình với dữ liệu từ đối tác không?
Giải pháp thực thể AWS được tích hợp nguyên bản trong AWS Clean Rooms. Bạn có thể sử dụng so khớp dựa trên quy tắc hoặc dựa trên nhà cung cấp dịch vụ dữ liệu để chuẩn bị, so khớp và liên kết dữ liệu người dùng của bạn với dữ liệu của đối tác bằng bất kỳ khóa chung nào do bạn chọn để sử dụng (chẳng hạn như mã định danh giả danh) trong cộng tác được tăng cường quyền riêng tư của AWS Clean Rooms. Để áp dụng tính năng so khớp của Giải pháp thực thể AWS trong cộng tác, bạn phải sử dụng dữ liệu được lưu trữ trong Amazon S3.
AWS Clean Rooms được cung cấp ở Khu vực AWS nào?
AWS Clean Rooms được cung cấp ở Miền Đông Hoa Kỳ (Ohio), Miền Đông Hoa Kỳ (Bắc Virginia), Miền Tây Hoa Kỳ (Oregon), Châu Á Thái Bình Dương (Seoul), Châu Á Thái Bình Dương (Singapore), Châu Á Thái Bình Dương (Sydney), Châu Á Thái Bình Dương (Tokyo), Châu Âu (Frankfurt), Châu Âu (Ireland), Châu Âu (London) và Châu Âu (Stockholm).
Ai trả tiền cho các hoạt động hợp tác trong AWS Clean Rooms?
Với AWS Clean Rooms, bạn có thể sử dụng các quy tắc phân tích SQL linh hoạt và công nghệ máy học tăng cường quyền riêng tư để đáp ứng nhu cầu kinh doanh của bạn. Khi bạn sử dụng phân tích SQL, bạn có thể linh hoạt chọn xem cộng tác viên nào chi trả cho công suất điện toán của các truy vấn SQL chạy trong một phiên cộng tác, tính theo đơn vị xử lý phòng sạch (CRPU) – giờ trên cơ sở mỗi giây (với phí tối thiểu 60 giây). Khi bạn sử dụng AWS Clean Rooms ML, bạn chỉ trả tiền cho các quá trình đào tạo mô hình mà bạn yêu cầu và cho các phân khúc đối tượng tương tự được tạo theo mức giá cho mỗi 1.000 hồ sơ. Để biết thêm thông tin, hãy tham khảo Giá AWS Clean Rooms.
Ai trả tiền cho việc sử dụng các kỹ thuật so khớp Giải pháp thực thể AWS trên AWS Clean Rooms
Với Giải pháp thực thể AWS trên AWS Clean Rooms, bạn có thể sử dụng tập dữ liệu về nhà cung cấp sử dụng so khớp dựa trên quy tắc hoặc dựa trên nhà cung cấp dịch vụ dữ liệu (chẳng hạn như LiveRamp).
Khi bạn sử dụng so khớp dựa trên quy tắc, ít nhất một thành viên trong phiên cộng tác được yêu cầu chuẩn bị dữ liệu của họ trước khi so khớp với tập dữ liệu của đối tác, trừ khi họ đã chuẩn bị dữ liệu bằng Giải pháp thực thể AWS trước khi tạo hoặc tham gia cộng tác. Thành viên này sẽ chỉ trả phí cho việc chuẩn bị dữ liệu nếu được sử dụng. Bất kỳ thành viên nào tham gia cộng tác đều có thể trả phí so khớp dữ liệu. So khớp dữ liệu cũng yêu cầu thanh toán khoản phí một lần cho mỗi phiên cộng tác và phí này được chỉ định cho bất kỳ cộng tác viên nào trả phí so khớp dữ liệu.
Khi bạn sử dụng so khớp dựa trên nhà cung cấp dịch vụ dữ liệu, tất cả các thành viên trong phiên cộng tác được yêu cầu có gói đăng ký nhà cung cấp để chuẩn bị dữ liệu bằng ID nhà cung cấp. Tất cả thành viên trong phiên cộng tác đều được yêu cầu chuẩn bị dữ liệu bằng ID nhà cung cấp trước khi so khớp với tập dữ liệu của đối tác, trừ khi họ đã chuẩn bị dữ liệu bằng Giải pháp thực thể AWS trước khi tạo hoặc tham gia cộng tác. Bất kỳ thành viên nào tham gia cộng tác đều có thể trả phí so khớp dữ liệu bằng ID của nhà cung cấp. Ngoài ra, thành viên trả phí so khớp dữ liệu được yêu cầu sử dụng gói đăng ký nhà cung cấp. Bạn có thể sử dụng gói đăng ký công khai được niêm yết trên Trao đổi dữ liệu trên AWS (ADX) hoặc mua gói đăng ký riêng trực tiếp với nhà cung cấp dịch vụ dữ liệu do bạn lựa chọn, sau đó dùng tùy chọn Sử dụng gói đăng ký của riêng bạn (BYOS) cho ADX.
Để biết thêm thông tin, hãy xem định giá Giải pháp thực thể AWS trên AWS Clean Rooms.
Công nghệ máy học AWS Clean Rooms
Máy học AWS Clean Rooms là gì?
AWS Clean Rooms ML giúp bạn và đối tác áp dụng máy học (ML) tăng cường quyền riêng tư để tạo thông tin chuyên sâu dự đoán mà không cần phải chia sẻ dữ liệu thô với nhau. AWS Clean Rooms ML hỗ trợ tính năng lập mô hình máy học (ML) tùy chỉnh và tương tự. Với tính năng lập mô hình tùy chỉnh, bạn có thể đưa vào một mô hình tùy chỉnh để đào tạo và chạy suy luận trên các tập dữ liệu chung mà không cần chia sẻ dữ liệu cơ sở hoặc sở hữu trí tuệ giữa các cộng tác viên. Với tính năng lập mô hình tương tự, bạn có thể sử dụng mô hình do AWS tạo ra để tạo một tập hợp mở rộng gồm bản ghi tương tự, dựa trên một mẫu nhỏ gồm các bản ghi mà đối tác của bạn đưa vào quá trình cộng tác.
AWS Clean Rooms ML giúp khách hàng trong nhiều trường hợp sử dụng. Ví dụ: nhà quảng cáo có thể đưa mô hình và dữ liệu độc quyền của họ vào quá trình cộng tác Clean Rooms, sau đó mời các bên gửi kết nối dữ liệu của họ để đào tạo và triển khai mô hình ML tùy chỉnh để giúp tăng hiệu quả chiến dịch; tổ chức tài chính có thể sử dụng lịch sử hồ sơ giao dịch để đào tạo mô hình ML tùy chỉnh và mời các đối tác tham gia quá trình cộng tác Clean Rooms để phát hiện các giao dịch có khả năng gian lận; tổ chức nghiên cứu và mạng lưới bệnh viện có thể tìm ứng viên tương tự những người tham gia thử nghiệm lâm sàng hiện tại để giúp tăng tốc độ nghiên cứu lâm sàng; các thương hiệu và nhà xuất bản có thể lập mô hình các phân khúc tương tự của khách hàng trong thị trường và cung cấp trải nghiệm quảng cáo có mức độ liên quan cao mà không cần chia sẻ dữ liệu cơ sở giữa hai công ty với nhau.
Tính năng lập mô hình tùy chỉnh hoạt động như thế nào?
Với tính năng lập mô hình tùy chỉnh của AWS Clean Rooms ML, bạn có thể sử dụng mô hình máy học (ML), thuật toán và dữ liệu của riêng bạn khi cộng tác với các đối tác để đào tạo mô hình ML và chạy suy luận trên các tập dữ liệu chung mà không cần chia sẻ dữ liệu nhạy cảm hoặc mô hình ML độc quyền.
Tính năng lập mô hình tùy chỉnh của AWS Clean Rooms ML hỗ trợ quy trình làm việc đào tạo ML và suy luận ML. Trong cả hai quy trình làm việc này, bạn sẽ bắt đầu bằng việc xác định một truy vấn Spark SQL cho AWS Clean Rooms được dùng để tạo tập dữ liệu cho bước đào tạo hoặc suy luận. Tập dữ liệu trung gian được lưu giữ trong quá trình cộng tác phòng sạch và chỉ có thể được sử dụng cho các tác vụ AWS Clean Rooms ML đã được phê duyệt. Bước thứ hai là đào tạo mô hình hoặc suy luận mô hình ML. Các mô hình và mã ML được đóng gói trong một hình ảnh bộ chứa. Mô hình đã được đào tạo có thể được giữ lại trong quá trình cộng tác và sử dụng làm một phần trong quy trình làm việc suy luận. Với AWS Clean Rooms ML, dữ liệu của bạn chỉ được sử dụng để đào tạo mô hình tùy chỉnh của bạn và sẽ không được chia sẻ giữa các cộng tác viên hoặc sử dụng cho việc đào tạo mô hình AWS. Bạn có thể xóa dữ liệu của mình khỏi Clean Rooms ML hoặc xóa mô hình tùy chỉnh bất cứ khi nào bạn muốn, cũng như có thể áp dụng những biện pháp kiểm soát nâng cao quyền riêng tư để bảo vệ các dữ liệu nhạy cảm mà bạn đưa vào trong quá trình cộng tác. Để áp dụng tính năng lập mô hình tùy chỉnh của AWS Clean Rooms ML, bạn cần sử dụng Spark SQL làm công cụ phân tích.
Tính năng lập mô hình tương tự hoạt động như thế nào?
Với tính năng lập mô hình tương tự của AWS Clean Rooms ML, bạn có thể sử dụng mô hình do AWS tạo ra để tạo một tập hợp mở rộng gồm bản ghi tương tự, dựa trên một mẫu nhỏ gồm các bản ghi mà đối tác của bạn đưa vào quá trình cộng tác, đồng thời bảo vệ dữ liệu cơ sở của bạn và đối tác. Bạn có thể mời các đối tác vào phòng sạch và áp dụng mô hình ML do AWS tạo ra, được đào tạo cho mỗi phiên cộng tác để tạo ra các tập dữ liệu tương tự chỉ trong một vài bước, tiết kiệm thời gian phát triển mất hàng tháng trời để xây dựng, đào tạo, điều chỉnh và triển khai mô hình của riêng bạn. Tính năng lập mô hình tương tự của AWS Clean Rooms ML được xây dựng và kiểm thử trên nhiều tập dữ liệu khác nhau như thương mại điện tử và phát trực tuyến video, dịch vụ này có thể giúp khách hàng cải thiện độ chính xác của quá trình lập mô hình tương tự lên đến 36% khi so sánh với mức cơ sở đại diện trong ngành. Trong các ứng dụng thực tế như tìm kiếm khách hàng mới, mức cải thiện về độ chính xác này có thể tiết kiệm hàng triệu đô la.
Tính năng lập mô hình tương tự của AWS Clean Rooms ML lấy một mẫu nhỏ gồm các bản ghi từ một bên và tìm một tập hợp bản ghi lớn hơn nhiều hoặc phân khúc tương tự từ tập dữ liệu của một cộng tác viên khác. Bạn có thể chỉ định kích thước mong muốn của phân khúc đối tượng tương tự thu được và AWS Clean Rooms ML sẽ khớp riêng các hồ sơ duy nhất trong danh sách mẫu của bạn với các hồ sơ trong tập dữ liệu của đối tác, sau đó đào tạo một mô hình ML có khả năng dự đoán mức độ tương tự của từng hồ sơ trong tập dữ liệu của cộng tác viên với các hồ sơ trong mẫu của bạn. Công nghệ máy học AWS Clean Rooms sẽ tự động nhóm các hồ sơ tương tự như danh sách mẫu và xuất ra kết quả phân đoạn tương tự. ML AWS Clean Rooms loại bỏ nhu cầu chia sẻ dữ liệu để xây dựng, đào tạo và triển khai các mô hình ML với các đối tác của bạn. Với AWS Clean Rooms ML, dữ liệu của bạn chỉ được sử dụng để đào tạo mô hình của bạn và không được sử dụng để đào tạo mô hình của AWS. Bạn có thể sử dụng các biện pháp kiểm soát trực quan giúp bạn và các đối tác của bạn tinh chỉnh kết quả dự đoán của mô hình. Để áp dụng tính năng lập mô hình tương tự AWS Clean Rooms ML, tập dữ liệu đào tạo của bạn phải sử dụng dữ liệu được lưu trữ trong Amazon S3. Dữ liệu hạt giống có thể được lưu trữ trong Amazon S3 hoặc được tạo bằng truy vấn SQL trong một phiên cộng tác.
Bảo mật và bảo vệ dữ liệu
AWS Clean Rooms giúp bảo vệ dữ liệu như thế nào?
Bảo vệ dữ liệu bắt đầu từ nền tảng bảo mật của AWS và AWS Clean Rooms được xây dựng dựa trên các dịch vụ bảo mật AWS bao gồm Quản lý danh tính và truy cập trong AWS (IAM), Dịch vụ quản lý khóa của AWS (KMS) và AWS CloudTrail. Tính năng này cho phép bạn mở rộng chiến lược bảo vệ dữ liệu hiện có của mình sang khối lượng công việc cộng tác dữ liệu. Với AWS Clean Rooms, bạn không còn cần lưu trữ hoặc duy trì bản sao dữ liệu của mình bên ngoài môi trường AWS và gửi cho một bên khác để tiến hành phân tích nhằm thu được thông tin chuyên sâu về người tiêu dùng, đo lường tiếp thị, dự báo hoặc đánh giá rủi ro.
Khi thiết lập phiên cộng tác AWS Clean Rooms và sử dụng phân tích SQL, bạn có thể chỉ định các khả năng khác nhau cho từng thành viên cộng tác để phù hợp với các trường hợp sử dụng cụ thể của bạn. Ví dụ: nếu bạn muốn đầu ra truy vấn chuyển đến một thành viên khác, bạn có thể chỉ định một thành viên làm người chạy truy vấn có thể viết truy vấn và một thành viên khác làm người nhận kết quả truy vấn có thể nhận kết quả. Như vậy, người tạo phiên cộng tác có khả năng đảm bảo rằng thành viên có khả năng truy vấn sẽ không có quyền truy cập vào kết quả truy vấn.
AWS Clean Rooms cũng có các biện pháp kiểm soát truy vấn SQL để giúp bạn hạn chế loại truy vấn hoặc truy vấn cụ thể có thể chạy trên bảng dữ liệu của mình thông qua cấu hình quy tắc phân tích. AWS Clean Rooms hỗ trợ ba loại quy tắc phân tích SQL: tổng hợp, danh sách và tùy chỉnh. Với quy tắc phân tích tổng hợp, bạn có thể định cấu hình bảng của mình để chỉ cho phép chạy những truy vấn tạo số liệu thống kê tổng hợp (chẳng hạn như đo lường chiến dịch hoặc phân bổ). Với quy tắc phân tích danh sách, bạn có thể cấu hình biện pháp kiểm soát sao cho các truy vấn chỉ có thể phân tích giao điểm của tập dữ liệu với giao điểm của thành viên có thể thực hiện truy vấn. Với quy tắc phân tích tùy chỉnh, bạn có thể định cấu hình biện pháp kiểm soát cấp độ truy vấn để cho phép các tài khoản hoặc truy vấn cụ thể được chạy trên tập dữ liệu của bạn. Khi sử dụng quy tắc phân tích tùy chỉnh, bạn có thể chọn sử dụng Quyền riêng tư khác biệt. Quyền riêng tư khác biệt của AWS Clean Rooms giúp bạn bảo vệ quyền riêng tư của người dùng bằng các biện pháp kiểm soát trực quan và được hỗ trợ về mặt toán học chỉ trong vài cú nhấp chuột. Là một chức năng được quản lý đầy đủ của AWS Clean Rooms, bạn không cần phải có kinh nghiệm trước đó về quyền riêng tư khác biệt để ngăn chặn việc định danh lại người dùng của mình. Bạn còn có thể kiểm soát ngưỡng tổng hợp, ngăn các truy vấn đi sâu xuống các nhóm nhỏ, có thể nhận dạng lại.
Với Công nghệ máy học AWS Clean Rooms, dữ liệu của bạn chỉ được sử dụng để đào tạo mô hình của bạn và không được sử dụng để đào tạo mô hình của AWS. Công nghệ máy học AWS Clean Rooms không sử dụng dữ liệu phân đoạn đào tạo hoặc phân đoạn tương tự của bất kỳ công ty nào với công ty khác và bạn có thể xóa dữ liệu mô hình và đào tạo của mình bất cứ khi nào bạn muốn.
Tôi có phải lưu trữ dữ liệu của mình trong AWS Clean Rooms để có thể sử dụng dữ liệu đó trong một phiên cộng tác không?
Không. Tập dữ liệu được lưu trữ trong hồ dữ liệu AWS hoặc Snowflake của cộng tác viên và không di chuyển. AWS Clean Rooms tạm thời đọc dữ liệu từ tài khoản của cộng tác viên để chạy truy vấn, so khớp bản ghi, đào tạo mô hình ML hoặc mở rộng phân đoạn hạt giống. Kết quả phân tích được gửi đến vị trí S3 được thiết kế để phân tích. Không có dữ liệu nào được đọc từ bất kỳ hồ dữ liệu nào được lưu trữ vĩnh viễn trong AWS trong quá trình cộng tác và bất kỳ dữ liệu nào được đọc tạm thời vào môi trường AWS Clean Rooms sẽ bị xóa sau khi hoàn tất truy vấn.
Giải pháp thực thể AWS trên AWS Clean Rooms tạo ra tập dữ liệu ánh xạ giữa các mã định danh của mỗi bên trong một phiên cộng tác. Tập dữ liệu ánh xạ được quản lý bằng AWS Clean Rooms. Không thành viên nào trong phiên cộng tác có thể xem hoặc tải xuống bảng ánh xạ. Nếu tất cả các thành viên trong phiên cộng tác đồng ý nới lỏng việc thực thi quyền riêng tư này, bảng ánh xạ có thể được truy vấn cho các trường hợp sử dụng cụ thể. Một trong hai bên có thể xóa bảng tại bất kỳ thời điểm nào.
Các mô hình được tạo bởi công nghệ máy học AWS Clean Rooms được lưu trữ theo dịch vụ, có thể được mã hóa bằng khóa của AWS KMS do khách hàng quản lý và khách hàng có thể xóa bất cứ lúc nào.
Làm thế nào để luôn tuân thủ luật hiện hành về quyền riêng tư của dữ liệu khi sử dụng AWS Clean Rooms để cộng tác với những người khác?
Nhờ các quy tắc mã hóa và phân tích của AWS Clean Rooms, bạn có thể kiểm soát một cách chi tiết loại thông tin mà bạn muốn chia sẻ. Là cộng tác viên dữ liệu, bạn chịu trách nhiệm đánh giá rủi ro trong từng phiên cộng tác, bao gồm cả rủi ro nhận diện lại, đồng thời tự mình tiến hành thẩm định chuyên sâu thêm để đảm bảo tuân thủ bất kỳ luật nào về quyền riêng tư dữ liệu. Nếu dữ liệu bạn đang chia sẻ có tính chất nhạy cảm hoặc được quản lý, chúng tôi đề xuất bạn cũng nên vận dụng các thỏa thuận pháp lý và cơ chế kiểm tra phù hợp để củng cố giảm thiểu rủi ro về quyền riêng tư.
Có bất kỳ giới hạn nào khi cộng tác trong AWS Clean Rooms không?
Có. Điều khoản dịch vụ AWS nghiêm cấm một số trường hợp sử dụng đối với hoạt động cộng tác trong AWS Clean Rooms.
AWS Clean Rooms có tuân thủ HIPAA không?
Có, chương trình tuân thủ của AWS đối với HIPAA bao gồm AWS Clean Rooms dưới dạng Dịch vụ tuân thủ HIPAA. Nếu bạn đã thực hiện Thỏa thuận hợp tác kinh doanh (BAA) với AWS, giờ đây bạn có thể sử dụng AWS Clean Rooms để tạo các phiên cộng tác tuân thủ HIPAA. Nếu bạn chưa có BAA hay còn có câu hỏi về việc sử dụng AWS cho các ứng dụng tuân thủ HIPAA, hãy liên hệ với chúng tôi để biết thêm thông tin.
Để tìm hiểu thêm, hãy xem các tài nguyên sau:
Phân tích SQL
Spark SQL của AWS Clean Rooms là gì?
Bạn có thể lựa chọn sử dụng công cụ phân tích Spark để chạy truy vấn bằng phương ngữ Spark SQL trong hoạt động cộng tác AWS Clean Rooms. Spark SQL của AWS Clean Rooms cung cấp các kích thước điện toán có thể định cấu hình để cung cấp nhiều quyền kiểm soát hơn đối với hiệu năng giá khi chạy khối lượng công việc SQL. Để áp dụng Quyền riêng tư khác biệt của AWS Clean Rooms hoặc sử dụng các quy tắc phân tích danh sách hoặc tổng hợp trong quá trình cộng tác, bạn phải dùng SQL làm công cụ phân tích.
Spark SQL của AWS Clean Rooms sử dụng loại phiên bản mặc định CR.1X, cung cấp 4 vCPU, bộ nhớ 30 GB và dung lượng lưu trữ 100 GB. Bạn có thể chọn phân bổ nhiều tài nguyên hơn để chạy khối lượng công việc Spark SQL bằng cách chọn loại phiên bản CR.4X lớn hơn, cung cấp 16 vCPU, bộ nhớ 120 GB và dung lượng lưu trữ 400 GB. Kích thước phiên bản lớn hơn có thể mang lại lợi ích cho khối lượng công việc SQL xử lý khối lượng dữ liệu lớn và thực hiện phân tích phức tạp, giúp phân bổ khối lượng công việc trên nhiều tài nguyên hơn. Tìm hiểu thêm về vCPU, bộ nhớ và kho lưu trữ được liên kết cho mỗi cấu hình tại đây.
Làm thế nào để cấu hình quy tắc phân tích SQL?
Trong quy tắc phân tích SQL, bạn cấu hình các biện pháp kiểm soát theo cấp độ cột, giúp bạn xác định cách có thể sử dụng từng cột trong truy vấn. Ví dụ: bạn có thể chỉ định những cột có thể được dùng để tính toán số liệu thống kê tổng hợp – chẳng hạn như SUM(price) – và những cột có thể được dùng để kết hợp bảng của bạn với những thành viên khác trong phiên cộng tác. Trong quy tắc phân tích Tổng hợp, bạn cũng có thể xác định ngưỡng tổng hợp tối thiểu mà từng hàng đầu ra phải đáp ứng. Những hàng không đáp ứng ngưỡng tối thiểu sẽ được AWS Clean Rooms tự động lọc ra.
Tôi có thể xem truy vấn nào đang được các thành viên cộng tác chạy trên dữ liệu của tôi không?
Có. Bạn sẽ có thể định cấu hình AWS Clean Rooms để xuất bản các bản ghi truy vấn trong Bản ghi Amazon CloudWatch. Với quy tắc phân tích tùy chỉnh, bạn cũng có thể xem xét các truy vấn (được lưu trữ trong mẫu phân tích) trước khi các truy vấn đó chạy trong phiên cộng tác.
Quyền riêng tư khác biệt của AWS Clean Rooms
Quyền riêng tư khác biệt là gì?
Quyền riêng tư khác biệt là một khuôn khổ đã được chứng minh về mặt toán học là có thể giúp bảo vệ quyền riêng tư dữ liệu. Lợi ích chính đằng sau quyền riêng tư khác biệt là bảo vệ dữ liệu ở cấp độ cá nhân bằng cách thêm một lượng ngẫu nhiên có kiểm soát — hay còn gọi là nhiễu — để che giấu sự hiện diện hay vắng mặt của bất kỳ cá nhân nào trong tập dữ liệu đang được phân tích.
Quyền riêng tư khác biệt của AWS Clean Rooms tốt hơn so với các quy trình triển khai nguồn mở hiện có như thế nào?
Quyền riêng tư khác biệt của AWS Clean Rooms giúp bạn bảo vệ quyền riêng tư của người dùng bằng các biện pháp kiểm soát trực quan và được hỗ trợ về mặt toán học chỉ trong vài bước. Là một chức năng được quản lý đầy đủ của AWS Clean Rooms, bạn không cần phải có kinh nghiệm trước đó về quyền riêng tư khác biệt để ngăn chặn việc định danh lại người dùng của mình. Quyền riêng tư khác biệt của AWS Clean Rooms che đậy sự đóng góp dữ liệu của bất kỳ cá nhân nào từ việc tạo thông tin chuyên sâu tổng hợp trong phiên cộng tác để bạn có thể chạy một loạt các truy vấn SQL để tạo thông tin chuyên sâu về các chiến dịch quảng cáo, quyết định đầu tư, nghiên cứu lâm sàng và hơn thế nữa.
Làm thế nào để sử dụng Quyền riêng tư khác biệt AWS Clean Rooms?
Bạn có thể bắt đầu sử dụng Quyền riêng tư khác biệt AWS Clean Rooms chỉ với vài bước sau khi bắt đầu hoặc tham gia cộng tác AWS Clean Rooms với tư cách là thành viên có khả năng đóng góp dữ liệu. Sau khi tạo bảng đã định cấu hình, tức là tham chiếu đến bảng của bạn trong Danh mục dữ liệu AWS Glue, bạn chỉ cần chọn bật quyền riêng tư khác biệt trong khi thêm quy tắc phân tích tùy chỉnh vào bảng đã định cấu hình khi sử dụng công cụ phân tích SQL. Tiếp theo, bạn liên kết bảng đã định cấu hình với phiên cộng tác AWS Clean Rooms và định cấu hình chính sách bảo mật khác biệt trong quá trình cộng tác để cung cấp bảng của bạn để truy vấn. Bạn có thể sử dụng chính sách mặc định để nhanh chóng hoàn tất thiết lập hoặc tùy chỉnh chính sách đó để đáp ứng các yêu cầu cụ thể của bạn. Để áp dụng Quyền riêng tư khác biệt của AWS Clean Rooms trong quá trình cộng tác, bạn phải sử dụng dữ liệu được lưu trữ trong Amazon S3 và SQL làm công cụ phân tích.
Sau khi Quyền riêng tư khác biệt của AWS Clean Rooms được thiết lập, đối tác cộng tác của bạn có thể bắt đầu chạy các truy vấn trên bảng của bạn – mà không cần có kiến thức chuyên môn về các khái niệm quyền riêng tư khác biệt hay yêu cầu đối tác của họ thiết lập thêm. Với Quyền riêng tư khác biệt AWS Clean Rooms, người chạy truy vấn có thể chạy các phân tích tùy chỉnh và linh hoạt bao gồm các mẫu truy vấn phức tạp với biểu thức bảng phổ biến (CTE) và các hàm tổng hợp thường được sử dụng như COUNT và SUM.
Điện toán mã hóa
Điện toán mật mã hóa là gì?
Điện toán mã hóa là phương pháp bảo vệ và mã hóa dữ liệu nhạy cảm trong quá trình sử dụng. Dữ liệu có thể được mã hóa khi ở trạng thái đang được lưu trữ, đang được truyền và trong quá trình sử dụng. Mã hóa nghĩa là chuyển đổi dữ liệu văn bản thuần thành dữ liệu được mã hóa và không thể giải mã được nếu không có “khóa” đặc thù. Giao điểm tập hợp riêng (PSI) là một loại điện toán mã hóa cho phép từ hai bên trở lên nắm giữ tập dữ liệu so sánh các phiên bản được mã hóa để thực hiện tính toán. Quá trình mã hóa diễn ra tại chỗ với khóa bí mật dùng chung của đối tượng cộng tác. C3R hỗ trợ cả công cụ phân tích Spark SQL hay công cụ phân tích SQL.
Điện toán mật mã học dành cho Clean Rooms (C3R) là gì?
AWS Clean Rooms bao gồm chức năng Điện toán mật mã học dành cho Clean Rooms (C3R), có nhiệm vụ cung cấp tùy chọn mã hóa trước dữ liệu bằng công cụ mã hóa phía máy khách – một SDK hoặc giao diện dòng lệnh (CLI) – sử dụng khóa bí mật dùng chung với những người tham gia khác trong một phiên cộng tác của AWS Clean Rooms. Dữ liệu sẽ được mã hóa khi chạy truy vấn.