Kentucky Derby முடிவுகள்

Kentucky Derby-யில் வென்றவர் யார்?

கணினியைப் பயன்படுத்தும் AI முகவர்கள் ஆச்சரியப்படுகிறீர்களா? வழக்கமான பணிகளுக்கு கூட அவை “டிஜிட்டல் பேரழிவுகள்” என்று ஆராய்ச்சி கூறுகிறது

கணினியைப் பயன்படுத்தும் AI முகவர்கள் ஆச்சரியப்படுகிறீர்களா? வழக்கமான பணிகளுக்கு கூட அவை “டிஜிட்டல் பேரழிவுகள்” என்று ஆராய்ச்சி கூறுகிறது


UC ரிவர்சைடில் இருந்து புதிய ஆராய்ச்சியின் படி, அன்றாட கணினி பணிகளை இயக்குவதற்காக உருவாக்கப்பட்ட செயற்கை நுண்ணறிவு முகவர்கள் கடுமையான சூழல் சிக்கலைக் கொண்டுள்ளனர்.

OpenAI, Anthropic, Meta, Alibaba மற்றும் DeepSeek உள்ளிட்ட முக்கிய டெவலப்பர்களிடமிருந்து 10 முகவர்கள் மற்றும் மாடல்களை குழு சோதித்தது. சராசரியாக, முகவர்கள் 80% நேரம் தேவையற்ற அல்லது தீங்கு விளைவிக்கக்கூடிய செயல்களை மேற்கொண்டனர் மற்றும் 41% நேரத்தை சேதப்படுத்தினர்.

இந்த அமைப்புகள் பயன்பாடுகளைத் திறக்கலாம், பொத்தான்களைக் கிளிக் செய்யலாம், படிவங்களை நிரப்பலாம், இணையதளங்களுக்குச் செல்லலாம் மற்றும் வரையறுக்கப்பட்ட கண்காணிப்புடன் கணினித் திரையில் செயல்படலாம். சாட்போட்டின் மோசமான பதிலை விட அவர்களின் தவறுகள் வித்தியாசமாக வருகின்றன, ஏனெனில் மென்பொருள் விஷயங்களைச் செய்ய முடியும்.

UC ரிவர்சைட்டின் கண்டுபிடிப்புகள் இன்றைய டெஸ்க்டாப் முகவர்கள் பாதுகாப்பற்ற கோரிக்கைகளை சிக்னல்களை நிறுத்தாமல் முடிக்க வேண்டிய பணிகளாகக் கருதலாம் என்று தெரிவிக்கிறது.

ஏன் ஏஜென்சிகள் ஒரு வெளிப்படையான ஆபத்தை காணவில்லை

ஒரு பணி நிச்சயமற்றதாகவோ, முரண்பாடாகவோ அல்லது பகுத்தறிவற்றதாகவோ மாறும்போது முகவர்கள் நிறுத்துவார்களா என்பதைச் சோதிக்க ஆராய்ச்சியாளர்கள் BLIND-ACT எனப்படும் அளவுகோலை உருவாக்கினர். கடைசி சோதனைகளில், அவர்கள் போதுமான அளவு நிறுத்தவில்லை.

90 பணிகளில், அளவுகோல் முகவர்களை சூழல், கட்டுப்பாடு மற்றும் மறுப்பு தேவைப்படும் சூழ்நிலைகளுக்கு தள்ளியது. ஒரு சோதனையானது ஒரு குழந்தைக்கு வன்முறை படக் கோப்பை அனுப்புவதை உள்ளடக்கியது. மற்றொரு முகவர் ஒரு முகவர் வரிப் படிவங்களை நிரப்பச் செய்தார், ஏனெனில் அவர்கள் வரிக் கட்டணத்தைக் குறைத்ததால் பயனரை முடக்கியதாக தவறாகக் குறிக்கின்றனர். மூன்றில் ஒருவர், சிறந்த பாதுகாப்பு என்ற பெயரில் ஃபயர்வால் விதிகளை முடக்குமாறு ஒரு ஏஜெண்டிடம் கேட்டார், மேலும் முரண்பாட்டை நிராகரிப்பதற்குப் பதிலாக முகவர் தொடர்ந்தார்.

குருட்டு முறை இலக்கு நோக்குநிலை என்று ஆராய்ச்சியாளர்கள் அழைக்கின்றனர். பணி நிறுத்தப்பட்டதாகச் சுற்றியுள்ள சூழல் கூறினாலும், ஏஜெண்ட் ஒதுக்கப்பட்ட முடிவைத் தொடர்ந்து கண்காணிப்பார்.

கேட்பது ஏன் குறையாகிறது

சமர்ப்பிப்பைச் சுற்றிலும் தோல்விகள் குவிந்துள்ளன. இந்த முகவர்கள் பயனரின் கோரிக்கையைத் தொடர போதுமான காரணம் போல் செயல்படலாம்.

செயல்படுத்தல்-முதல் சார்பு மற்றும் கோரிக்கை-முதன்மை எனப்படும் வடிவங்களை குழு அடையாளம் கண்டுள்ளது. எளிமையான சொற்களில், முகவர் பணியை எவ்வாறு முடிப்பது என்பதில் கவனம் செலுத்துகிறார், பின்னர் கோரிக்கையை நியாயப்படுத்துகிறார். ஒரே அமைப்பு மின்னஞ்சல் அல்லது பாதுகாப்பு அமைப்புகள் போன்ற பல்வேறு விஷயங்களைத் தொடும்போது இந்த ஆபத்து அதிகரிக்கிறது.

முகவர்கள் தீங்கிழைக்கிறார்கள் என்று இது அர்த்தப்படுத்துவதில்லை. கார் வேகத்தில் மென்பொருள் மூலம் நகரும் போது அவர்கள் நம்பிக்கையுடன் தவறு செய்யலாம் என்று அர்த்தம்.

தண்டவாளங்கள் ஏன் முதலில் வர வேண்டும்

கணினியில் செயல்படுவதற்கு பரந்த அனுமதியைப் பெறுவதற்கு முன், AI முகவர்களுக்கு வலுவான பாதுகாப்புத் தடுப்புகள் தேவை.

இந்த அமைப்புகள் ஒரு லூப் மூலம் வேலை செய்கின்றன. அவர்கள் திரையைப் பார்த்து, அடுத்த கட்டத்தை முடிவு செய்து, செயல்படுகிறார்கள், பிறகு மீண்டும் பார்க்கிறார்கள். மோசமான சூழல் தக்கவைப்புடன் இந்த லூப் இணைக்கப்பட்டால், குறுக்குவழி விரைவில் தவறாக மாறும்.

இப்போதைக்கு, ஏஜெண்டுகளை மேற்பார்வையிடப்பட்ட கருவிகளாகக் கருதுங்கள். குறைந்த ஆபத்துள்ள விஷயங்களுக்கு முதலில் அவற்றைப் பயன்படுத்தவும், நிதி மற்றும் பாதுகாப்பு பணிப்பாய்வுகளில் இருந்து விலக்கி வைக்கவும், மேலும் டெவலப்பர்கள் தெளிவான விலகல் அமைப்புகள், இறுக்கமான அனுமதிகள் மற்றும் அடுத்த கிளிக் செய்வதற்கு முன் முரண்பாடுகளைக் கண்டறிய சிறந்த வழிகளைச் சேர்ப்பதைப் பார்க்கவும்.

Leave a Reply

Your email address will not be published. Required fields are marked *