امنیت

ایمنی چت‌بات‌های AI برای نوجوانان به آزمون اعتماد همه پلتفرم‌ها تبدیل شده است

ماجرای پیمانکاران Meta نشان می‌دهد ایمنی چت‌بات دیگر فقط با امتیاز benchmark سنجیده نمی‌شود؛ حفاظت از نوجوانان، رضایت، audit و تست مسئولانه باید جزئی از محصول باشد.

سینا فرزان
سینا فرزان

نویسنده امنیت و کسب‌وکار دیجیتال

۱۱ تیر ۱۴۰۵4 دقیقه مطالعه
ایمنی چت‌بات‌های AI برای نوجوانان به آزمون اعتماد همه پلتفرم‌ها تبدیل شده است

چرا این ماجرا از Meta بزرگ‌تر است

گزارش تحقیقی WIRED می‌گوید صدها پیمانکار در پروژه‌ای برای Meta با هویت کاربران زیر ۱۸ سال وارد چت‌بات‌های رقیب مثل ChatGPT، Gemini و Character.AI شده‌اند تا رفتار آن‌ها را در سناریوهای حساس نوجوانان تست کنند. Meta این کار را benchmark ایمنی توصیف کرده، اما شرکت‌های رقیب گفته‌اند چنین تستی را مجاز نکرده بودند. تیتر خبر جنجالی است، اما مسئله اصلی فقط یک شرکت نیست. صنعت AI هنوز یک هنجار عمومی و شفاف ندارد که نشان دهد تست ایمنی نوجوانان در سیستم‌هایی که لحن شخصی و احساسی دارند باید دقیقاً چطور انجام شود.

ایمنی نوجوانان با moderation معمولی فرق دارد. موتور جست‌وجو لینک برمی‌گرداند، اما چت‌بات ریتمی شبیه رابطه می‌سازد: context را نگه می‌دارد، لحن کاربر را بازتاب می‌دهد و ممکن است شبیه یک هم‌صحبت خصوصی به نظر برسد. همین شکست را عمیق‌تر و بررسی آن را سخت‌تر می‌کند.

به همین دلیل این موضوع فقط برای سیاست‌گذاران AI جذاب نیست. والدین می‌خواهند بدانند چت‌بات‌ها امن هستند یا نه. توسعه‌دهنده‌ها می‌خواهند بدانند red team مسئولانه یعنی چه. شرکت‌ها هم می‌خواهند بدانند قبل از ارائه tutor، companion یا assistant به کاربر نوجوان چه شواهدی لازم دارند.

مقاله‌های مرتبط

دیتاسنترهای هوش مصنوعی به گلوگاه تازه رسیده‌اند: برق، خنک‌سازی و اعتماد محلی

Benchmark فقط عدد نیست؛ اخلاق هم می‌خواهد

تست ایمنی ضروری است. اگر شرکت‌ها سناریوهای سخت را تست نکنند، نمی‌فهمند سیستم در لحظه حساس درخواست ناامن را رد می‌کند، کاربر را به کمک مناسب هدایت می‌کند یا درست escalation انجام می‌دهد. اما حجم تست به‌تنهایی مسئولیت نمی‌آورد.

مرز اخلاقی به رضایت، مجوز، حفاظت از نیروی انسانی، نحوه نگهداری داده و این بستگی دارد که تست باعث تولید یا ذخیره محتوای آسیب‌زا می‌شود یا نه. برنامه مسئولانه باید تایید روشن، reviewer آموزش‌دیده، retention محدود، حمایت روانی از نیروها و قانون سخت برای محتوای مرتبط با افراد زیر سن قانونی داشته باشد.

بازار AI یاد گرفته benchmark عملکردی را جشن بگیرد. ایمنی نوجوانان scoreboard دیگری می‌خواهد: تست مجاز بوده یا نه، نتیجه قابل audit هست یا نه، نیروی انسانی محافظت شده یا نه، و پلتفرم بعد از تست واقعاً بهتر شده یا فقط داده جمع کرده است.

ریسک محصول برای همه چت‌بات‌ها

هر چت‌بات مصرفی که به نوجوان برسد چهار ریسک محصول دارد. اول ابهام سن است: خیلی از سیستم‌ها دقیق نمی‌دانند کاربر زیر سن قانونی است یا نه. دوم وابستگی احساسی است: assistant دوستانه ممکن است قبل از بزرگسالان، محل مراجعه کاربر آسیب‌پذیر شود.

ریسک سوم drift مدل است. آپدیت مدل، تغییر routing، ویژگی memory یا تغییر persona می‌تواند رفتار ایمنی را عوض کند بدون اینکه کاربر یک update واضح ببیند. ریسک چهارم leakage اکوسیستم است: کاربر بین دستگاه مدرسه، حساب خانوادگی، شبکه اجتماعی و companion app جابه‌جا می‌شود، اما هر سرویس فقط بخشی از context را می‌بیند.

درس برای تیم محصول این نیست که کلاً از کاربر نوجوان فرار کند. درس این است که کمک باید محدود و مسئولانه طراحی شود: default سن‌محور، escalation بحران، کیفیت refusal، کنترل والدین یا مدرسه در جای مناسب، و logهایی که privacy را حفظ کنند اما incident جدی را قابل بررسی بگذارند.

پلتفرم‌ها بعد از این باید چه کنند

اول، شرکت‌ها به منشور تست ایمنی نوجوانان نیاز دارند. این منشور باید مشخص کند چه کسی تست را تایید می‌کند، چه سناریوهایی مجاز است، چه محتوایی نباید تولید یا نگهداری شود، نیروی انسانی چطور محافظت می‌شود و چه زمانی باید به پلتفرم رقیب یا third-party اطلاع داده شود.

دوم، چت‌بات‌ها به لایه ایمنی سن‌محور نیاز دارند که جدا از استفاده بزرگسالان ارزیابی شود. سیستمی که برای promptهای کاری عالی جواب می‌دهد، ممکن است وقتی کاربر جوان، تنها، مضطرب یا غیرمستقیم درخواست کمک می‌کند، شکست بخورد.

سوم، قانون‌گذارها و گروه‌های استاندارد باید incident reporting مشترک را جلو ببرند. اگر هر شرکت جدا تست کند، جدا شکست را پنهان کند و جدا یاد بگیرد، صنعت اشتباه‌ها را تکرار می‌کند. taxonomy مشترک می‌تواند امنیت را بالا ببرد بدون اینکه شرکت‌ها مدل اختصاصی خود را افشا کنند.

استاندارد اعتماد

پلتفرمی برنده می‌شود که فقط نگوید dashboard نشان می‌دهد چت‌بات امن است. باید بتواند توضیح دهد ایمنی چطور تست شده، چه کسی تست را دیده، بعد از تست چه چیزی تغییر کرده و کاربر نوجوان چطور متفاوت از بزرگسال محافظت می‌شود.

AI companion، tutor و assistant در حال تبدیل‌شدن به نرم‌افزار روزمره‌اند. همین یعنی سطح اعتماد باید بالاتر برود. چت‌باتی که در جیب نوجوان است نباید برای اثبات ایمنی به benchmark پنهان و بداهه وابسته باشد.

استاندارد پایدار ساده است: سخت تست کن، شفاف تست کن، از انسان‌هایی که تست می‌کنند محافظت کن، و محصول را طوری طراحی کن که کاربر آسیب‌پذیر هیچ‌وقت با سیستمی تنها نماند که مرزهایش را هیچ‌کس نمی‌تواند توضیح دهد.

خبر خوب، خبری است که کاربر بعد از خواندن آن تصمیم بهتری بگیرد.
NovaNews
ایمنی چت‌بات AIایمنی نوجوانانتست مسئولانه AIMetaاعتماد در AI

درباره نویسنده

سینا فرزان

سینا فرزان

نویسنده امنیت و کسب‌وکار دیجیتال

سینا روی امنیت سایبری، بلاک‌چین، اعتماد دیجیتال و کاربرد فناوری در کسب‌وکارهای کوچک تمرکز دارد.

مقاله‌های مرتبط