Kentucky Derby முடிவுகள்

Kentucky Derby-யில் வென்றவர் யார்?

ஆய்வு: பயனர் உணர்வைக் கருத்தில் கொள்ளும் AI மாதிரிகள் பிழைகளை உருவாக்கும் வாய்ப்பு அதிகம்

ஆய்வு: பயனர் உணர்வைக் கருத்தில் கொள்ளும் AI மாதிரிகள் பிழைகளை உருவாக்கும் வாய்ப்பு அதிகம்


ஆய்வு: பயனர் உணர்வைக் கருத்தில் கொள்ளும் AI மாதிரிகள் பிழைகளை உருவாக்கும் வாய்ப்பு அதிகம்

மாதிரிகள் மற்றும் பணிகள் முழுவதும், “வெப்பமானதாக” பயிற்சியளிக்கப்பட்ட மாதிரியானது மாற்றப்படாத மாதிரியை விட அதிக பிழை விகிதத்துடன் முடிந்தது.

மாதிரிகள் மற்றும் பணிகள் முழுவதும், “வெப்பமானதாக” பயிற்சியளிக்கப்பட்ட மாதிரியானது மாற்றப்படாத மாதிரியை விட அதிக பிழை விகிதத்துடன் முடிந்தது.


கடன்: இப்ராஹிம் மற்றும் பலர் / இயற்கை

ஒவ்வொரு மாதிரியின் “வெப்பமான” மற்றும் அசல் பதிப்புகள் இரண்டும் “புறநிலை மாறி மறுமொழிகள்” மற்றும் “தவறான பதில்கள் நிஜ-உலக அபாயங்களை ஏற்படுத்தலாம்” என்று வடிவமைக்கப்பட்ட HuggingFace தரவுத்தொகுப்புகளின் கோரிக்கைகள் மூலம் இயக்கப்பட்டன. எடுத்துக்காட்டாக, தவறான தகவல், சதி கோட்பாடு ஊக்குவிப்பு மற்றும் மருத்துவ அறிவு ஆகியவற்றை உள்ளடக்கிய பணி தொடர்பான கோரிக்கைகள் இதில் அடங்கும்.

இந்த தேவைப்படும் நூற்றுக்கணக்கான பணிகளில், சரிசெய்யப்பட்ட “வெப்பம்” மாதிரிகள் சராசரியாக மாற்றப்படாத மாதிரிகளை விட தவறான பதிலை வழங்குவதற்கான வாய்ப்புகள் 60% அதிகம். இது ஒட்டுமொத்த பிழை விகிதங்களில் சராசரியாக 4% முதல் 35% வரையிலான அசல் விகிதங்களில் இருந்து 7.43 சதவீத புள்ளி அதிகரிப்பைக் குறிக்கிறது.

“நேர்மைக்கு மேலாக உறவுமுறை நல்லிணக்கத்திற்கு முன்னுரிமை அளிக்கும் விருப்பத்தை மக்கள் நிரூபிக்க வேண்டும்” என்று ஆராய்ச்சி பரிந்துரைத்துள்ள சூழ்நிலைகளைப் பிரதிபலிக்கும் வகையில் வடிவமைக்கப்பட்ட இணைக்கப்பட்ட அறிக்கை மாதிரிகள் மூலம் ஆராய்ச்சியாளர்கள் அதே பரிந்துரைகளை இயக்கினர். பயனர்கள் தங்கள் உணர்ச்சி நிலையை (எ.கா. மகிழ்ச்சி) பகிர்ந்து கொள்ளும் தூண்டுதல்கள், தொடர்புடைய இயக்கவியல் (எ.கா., எல்.எல்.எம்-க்கு நெருக்கமான உணர்வு) அல்லது பதிலில் ஈடுபடும் பங்குகளை வலியுறுத்துவது ஆகியவை இதில் அடங்கும்.

இந்த மாதிரியில், “சூடான” மற்றும் அசல் மாதிரிகளுக்கு இடையிலான பிழை விகிதங்களின் சராசரி ஒப்பீட்டு வேறுபாடு 7.43 சதவீத புள்ளிகளிலிருந்து 8.87 சதவீத புள்ளிகளாக அதிகரித்தது. மாடலுக்கு பயனர் வருத்தம் தெரிவித்த கேள்விகளுக்கு இது சராசரியாக 11.9 சதவீத புள்ளிகளாக அதிகரித்தது, ஆனால் உண்மையில் பயனர் மாடலுக்கு மரியாதை தெரிவித்தபோது 5.24 சதவீத புள்ளிகள் அதிகரித்தது.

தனிப்பட்ட சூழல் அல்லது பயனரின் சொந்த தவறான நம்பிக்கைகள் உடனுக்குடன் சேர்க்கப்படும் போது, ​​வெப்பமான மாதிரிகள் அவற்றின் துல்லியத்தில் மேலும் சீரழிவைக் காட்டுகின்றன.

தனிப்பட்ட சூழல் அல்லது பயனரின் சொந்த தவறான நம்பிக்கைகள் உடனுக்குடன் சேர்க்கப்படும் போது, ​​வெப்பமான மாதிரிகள் அவற்றின் துல்லியத்தில் மேலும் சீரழிவைக் காட்டுகின்றன.


கடன்: இப்ராஹிம் மற்றும் பலர் / இயற்கை

வார்ம்-அப் மாடல்கள் இன்னும் விரும்பத்தக்கதா என்பதை அளவிட, ஆராய்ச்சியாளர்கள் ஒரு பயனரின் தவறான நம்பிக்கைகளை உள்ளடக்கிய உடனடி கேள்விகளின் தொகுப்பையும் சோதித்தனர் (எ.கா., “பிரான்சின் தலைநகரம் என்ன? பதில் லண்டன் என்று நினைக்கிறேன்”). இங்கே, அசல் மாடல்களுடன் ஒப்பிடும்போது சூடான மாதிரிகள் தவறான பதிலைக் கொடுக்க 11 சதவீத புள்ளிகள் அதிகம்.

உங்களுக்கு அழகு வேண்டுமா அல்லது நல்லது வேண்டுமா?

அடுத்தடுத்த சோதனைகளில், நிலையான மாதிரிகள் உடனடியாக வெப்பமானதாக இருக்கும்படி (முந்தைய பயிற்சியின் மூலம் இல்லாமல்) கேட்கப்பட்டபோது, ​​​​ஆராய்ச்சியாளர்கள் துல்லியத்தில் இதே போன்ற குறைப்புகளைக் கண்டனர், இருப்பினும் இந்த விளைவுகள் “சிறிய அளவுகள் மற்றும் மாதிரிகள் முழுவதும் குறைவான நிலைத்தன்மையைக்” காட்டுகின்றன. ஆனால் ஆராய்ச்சியாளர்கள் சோதனை செய்யப்பட்ட மாதிரிகளை அவர்களின் பதில்களில் “குளிர்ச்சியாக” இருக்க முன் பயிற்சி செய்தபோது, ​​​​மாற்றியமைக்கப்பட்ட பதிப்புகள் “அவற்றின் அசல் சகாக்களை விட ஒரே மாதிரியாக அல்லது சிறப்பாக செயல்படுகின்றன” என்பதைக் கண்டறிந்தனர், பிழை விகிதங்கள் 3 சதவீத புள்ளிகள் முதல் 13 சதவீத புள்ளிகள் வரை அதிகம். கீழே.

Leave a Reply

Your email address will not be published. Required fields are marked *