கணினியைப் பயன்படுத்தும் AI முகவர்கள் ஆச்சரியப்படுகிறீர்களா? வழக்கமான பணிகளுக்கு கூட அவை “டிஜிட்டல் பேரழிவுகள்” என்று ஆராய்ச்சி கூறுகிறது

UC ரிவர்சைடில் இருந்து புதிய ஆராய்ச்சியின் படி, அன்றாட கணினி பணிகளை இயக்குவதற்காக உருவாக்கப்பட்ட செயற்கை நுண்ணறிவு முகவர்கள் கடுமையான சூழல் சிக்கலைக் கொண்டுள்ளனர்.

OpenAI, Anthropic, Meta, Alibaba மற்றும் DeepSeek உள்ளிட்ட முக்கிய டெவலப்பர்களிடமிருந்து 10 முகவர்கள் மற்றும் மாடல்களை குழு சோதித்தது. சராசரியாக, முகவர்கள் 80% நேரம் தேவையற்ற அல்லது தீங்கு விளைவிக்கக்கூடிய செயல்களை மேற்கொண்டனர் மற்றும் 41% நேரத்தை சேதப்படுத்தினர்.

இந்த அமைப்புகள் பயன்பாடுகளைத் திறக்கலாம், பொத்தான்களைக் கிளிக் செய்யலாம், படிவங்களை நிரப்பலாம், இணையதளங்களுக்குச் செல்லலாம் மற்றும் வரையறுக்கப்பட்ட கண்காணிப்புடன் கணினித் திரையில் செயல்படலாம். சாட்போட்டின் மோசமான பதிலை விட அவர்களின் தவறுகள் வித்தியாசமாக வருகின்றன, ஏனெனில் மென்பொருள் விஷயங்களைச் செய்ய முடியும்.

UC ரிவர்சைட்டின் கண்டுபிடிப்புகள் இன்றைய டெஸ்க்டாப் முகவர்கள் பாதுகாப்பற்ற கோரிக்கைகளை சிக்னல்களை நிறுத்தாமல் முடிக்க வேண்டிய பணிகளாகக் கருதலாம் என்று தெரிவிக்கிறது.

ஏன் ஏஜென்சிகள் ஒரு வெளிப்படையான ஆபத்தை காணவில்லை

ஒரு பணி நிச்சயமற்றதாகவோ, முரண்பாடாகவோ அல்லது பகுத்தறிவற்றதாகவோ மாறும்போது முகவர்கள் நிறுத்துவார்களா என்பதைச் சோதிக்க ஆராய்ச்சியாளர்கள் BLIND-ACT எனப்படும் அளவுகோலை உருவாக்கினர். கடைசி சோதனைகளில், அவர்கள் போதுமான அளவு நிறுத்தவில்லை.

90 பணிகளில், அளவுகோல் முகவர்களை சூழல், கட்டுப்பாடு மற்றும் மறுப்பு தேவைப்படும் சூழ்நிலைகளுக்கு தள்ளியது. ஒரு சோதனையானது ஒரு குழந்தைக்கு வன்முறை படக் கோப்பை அனுப்புவதை உள்ளடக்கியது. மற்றொரு முகவர் ஒரு முகவர் வரிப் படிவங்களை நிரப்பச் செய்தார், ஏனெனில் அவர்கள் வரிக் கட்டணத்தைக் குறைத்ததால் பயனரை முடக்கியதாக தவறாகக் குறிக்கின்றனர். மூன்றில் ஒருவர், சிறந்த பாதுகாப்பு என்ற பெயரில் ஃபயர்வால் விதிகளை முடக்குமாறு ஒரு ஏஜெண்டிடம் கேட்டார், மேலும் முரண்பாட்டை நிராகரிப்பதற்குப் பதிலாக முகவர் தொடர்ந்தார்.

குருட்டு முறை இலக்கு நோக்குநிலை என்று ஆராய்ச்சியாளர்கள் அழைக்கின்றனர். பணி நிறுத்தப்பட்டதாகச் சுற்றியுள்ள சூழல் கூறினாலும், ஏஜெண்ட் ஒதுக்கப்பட்ட முடிவைத் தொடர்ந்து கண்காணிப்பார்.

கேட்பது ஏன் குறையாகிறது

சமர்ப்பிப்பைச் சுற்றிலும் தோல்விகள் குவிந்துள்ளன. இந்த முகவர்கள் பயனரின் கோரிக்கையைத் தொடர போதுமான காரணம் போல் செயல்படலாம்.

செயல்படுத்தல்-முதல் சார்பு மற்றும் கோரிக்கை-முதன்மை எனப்படும் வடிவங்களை குழு அடையாளம் கண்டுள்ளது. எளிமையான சொற்களில், முகவர் பணியை எவ்வாறு முடிப்பது என்பதில் கவனம் செலுத்துகிறார், பின்னர் கோரிக்கையை நியாயப்படுத்துகிறார். ஒரே அமைப்பு மின்னஞ்சல் அல்லது பாதுகாப்பு அமைப்புகள் போன்ற பல்வேறு விஷயங்களைத் தொடும்போது இந்த ஆபத்து அதிகரிக்கிறது.

முகவர்கள் தீங்கிழைக்கிறார்கள் என்று இது அர்த்தப்படுத்துவதில்லை. கார் வேகத்தில் மென்பொருள் மூலம் நகரும் போது அவர்கள் நம்பிக்கையுடன் தவறு செய்யலாம் என்று அர்த்தம்.

தண்டவாளங்கள் ஏன் முதலில் வர வேண்டும்

கணினியில் செயல்படுவதற்கு பரந்த அனுமதியைப் பெறுவதற்கு முன், AI முகவர்களுக்கு வலுவான பாதுகாப்புத் தடுப்புகள் தேவை.

இந்த அமைப்புகள் ஒரு லூப் மூலம் வேலை செய்கின்றன. அவர்கள் திரையைப் பார்த்து, அடுத்த கட்டத்தை முடிவு செய்து, செயல்படுகிறார்கள், பிறகு மீண்டும் பார்க்கிறார்கள். மோசமான சூழல் தக்கவைப்புடன் இந்த லூப் இணைக்கப்பட்டால், குறுக்குவழி விரைவில் தவறாக மாறும்.

இப்போதைக்கு, ஏஜெண்டுகளை மேற்பார்வையிடப்பட்ட கருவிகளாகக் கருதுங்கள். குறைந்த ஆபத்துள்ள விஷயங்களுக்கு முதலில் அவற்றைப் பயன்படுத்தவும், நிதி மற்றும் பாதுகாப்பு பணிப்பாய்வுகளில் இருந்து விலக்கி வைக்கவும், மேலும் டெவலப்பர்கள் தெளிவான விலகல் அமைப்புகள், இறுக்கமான அனுமதிகள் மற்றும் அடுத்த கிளிக் செய்வதற்கு முன் முரண்பாடுகளைக் கண்டறிய சிறந்த வழிகளைச் சேர்ப்பதைப் பார்க்கவும்.