
AI Trends ஊழியர்களால்
பேச்சு அங்கீகாரத்திற்குப் பின்னால் உள்ள AI இன் முன்னேற்றங்கள் சந்தை வளர்ச்சியை உந்துகின்றன, துணிகர மூலதனத்தை ஈர்க்கின்றன மற்றும் தொடக்க நிறுவனங்களுக்கு நிதியளித்தன, நிறுவப்பட்ட வீரர்களுக்கு சவால் விடுகின்றன.
மெட்டிகுலோஸ் ஆராய்ச்சியின் மதிப்பீட்டின்படி, 2025 ஆம் ஆண்டளவில் உலகளவில் $26.8 பில்லியன்களை எட்டும் என எதிர்பார்க்கப்படும் பேச்சு அங்கீகார சாதனங்களின் வளர்ந்து வரும் ஏற்றுக்கொள்ளல் மற்றும் பயன்பாடு சந்தையை இயக்குகிறது. நுண்ணறிவு பகுப்பாய்வு. சிறந்த வேகம் மற்றும் துல்லியம் ஆகியவை வளர்ந்து வரும் தொழில்நுட்பத்தின் நன்மைகளில் ஒன்றாகும்.

இந்த புதிய வளர்ச்சியின் மையத்தில் உள்ள ஒரு நிறுவனம், சான் பிரான்சிஸ்கோவை தளமாகக் கொண்ட அசெம்பிளிஏஐ, வீடியோக்கள், பாட்காஸ்ட்கள், தொலைபேசி அழைப்புகள் மற்றும் தொலைநிலை சந்திப்புகளை டிரான்ஸ்கிரிப்ட் செய்யும் திறன் கொண்ட பேச்சு அங்கீகார API ஐ வழங்குகிறது. நிறுவனம் 2017 இல் தலைமை நிர்வாக அதிகாரி டிலான் ஃபாக்ஸால் நிறுவப்பட்டது மற்றும் ஒய் காம்பினேட்டர், ஸ்டார்ட்அப் முடுக்கி மற்றும் என்விடியாவின் ஆதரவைப் பெற்றுள்ளது.
ஃபாக்ஸ் ஒரு உயர் தொழில்நுட்ப தொழில்முனைவோருக்கு அசாதாரண பின்னணியைக் கொண்டுள்ளது. ஜார்ஜ் வாஷிங்டன் பல்கலைக்கழகத்தில் வணிக நிர்வாகம், வணிகப் பொருளாதாரம் மற்றும் பொதுக் கொள்கை ஆகியவற்றில் பட்டம் பெற்றவர். சான் பிரான்சிஸ்கோவில் உள்ள சிஸ்கோவின் வளர்ந்து வரும் தயாரிப்பு ஆய்வகத்தில் மெஷின் லேர்னிங் சாப்ட்வேர் இன்ஜினியராக அவர் வேலையில் சேர்ந்தார், ஆழ்ந்த நரம்பியல் நெட்வொர்க்குகள் மற்றும் இயந்திர கற்றலில் பணியாற்றினார். அவர் அசெம்பிளி ஏஐக்கான யோசனையைப் பெற்றார் மற்றும் ஒய் காம்பினேட்டரிடமிருந்து மூலதனத்தை திரட்டினார், இது தொழில்நுட்பத்தை மேம்படுத்துவதற்கும் இயங்குவதற்கும் தரவு விஞ்ஞானிகள் மற்றும் பொறியாளர்களை வேலைக்கு அமர்த்த அனுமதித்தது.
க்கு அளித்த பேட்டியில் கேட்டுள்ளார் AI போக்குகள் எப்படி அவர் வணிக நிர்வாகம் மற்றும் பொருளாதாரத்தில் இருந்து உயர் தொழில்நுட்ப தொழில்முனைவோராக மாறினார், ஃபாக்ஸ் கூறினார்: “எப்படி நிரல் செய்வது என்று எனக்கு நானே கற்றுக் கொடுத்தேன், இது என்னை இயந்திர கற்றல் பாதையில் கொண்டு சென்றது. நான் கடினமான மென்பொருள் சவாலை தேடினேன், இது இயற்கை மொழி செயலாக்கத்திற்கு வழிவகுத்தது, இது என்னை சிஸ்கோவிற்கு அழைத்துச் சென்றது.” அந்த நேரத்தில் அவர்கள் ஆப்பிள் நிறுவனத்திற்கான சிரியில் பணிபுரிந்தனர்,
வேலையை விரைவுபடுத்த, சிஸ்கோ பேச்சு அங்கீகார மென்பொருளைப் பெற விரும்புகிறது; தேடலுக்காக ஃபாக்ஸ் பூனை இருக்கையில் இருந்தது. “நாங்கள் நுவான்ஸைப் பார்த்தோம்,” எடுத்துக்காட்டாக, சந்தைத் தலைவராகவும், அதன் போட்டியாளர்களைக் காட்டிலும் அதிக பேச்சு அங்கீகார மென்பொருளின் உரிமையாளராகவும் அங்கீகரிக்கப்பட்டது. (Microsoft’s $19.6 பில்லியனுக்கு Nuanceஐ கையகப்படுத்துவது இந்த ஆண்டின் இறுதிக்குள் நிறைவடையும் என்று எதிர்பார்க்கப்படுகிறது.) வளரும் இளம் தொழில்முனைவோர் ஈர்க்கப்படவில்லை. “துல்லியம் மற்றும் டெவலப்பர் அடிப்படையில் அனைத்து விருப்பங்களும் எவ்வளவு மோசமாக இருந்தன என்பது பைத்தியமாக இருந்தது,” என்று அவர் கூறினார்.
2008 இல் நிறுவப்பட்ட சான் பிரான்சிஸ்கோவை தளமாகக் கொண்ட ட்விலியோ நிறுவனத்தால் அவர் ஈர்க்கப்பட்டார், அந்த ஆண்டு கிளவுட்டில் ஹோஸ்ட் செய்யப்பட்ட தொலைபேசி அழைப்புகளை மேற்கொள்ளவும் பெறவும் ட்விலியோ குரல் API ஐ வெளியிட்டது. நிறுவனம் அதன் பின் $103 மில்லியன் துணிகர மூலதனத்தை திரட்டியுள்ளது. “டெவலப்பர்களுக்கான ஒரு நல்ல APIக்கான புதிய தரநிலைகளை அவர்கள் அமைத்தனர்” என்று ஃபாக்ஸ் கூறினார்.
“சூப்பர் துல்லியமான முடிவுகளைப் பெறுவதற்கும், டெவலப்பர்கள் தங்கள் தயாரிப்புகளில் API ஐ இணைப்பதை எளிதாக்குவதற்கும் AI மற்றும் இயந்திரக் கற்றலைப் பயன்படுத்துவதே Fox இன் யோசனையாக இருந்தது. ஒரு வாடிக்கையாளர் CallRail, இது அழைப்பு கண்காணிப்பு மற்றும் சந்தைப்படுத்தல் பகுப்பாய்வு மென்பொருளை வழங்குகிறது, இது மக்கள் ஏன் அழைக்கிறார்கள் என்பதைப் புரிந்துகொள்ள AssembyAI API ஐ இணைக்க திட்டமிட்டுள்ளது. ஜர்னல்.”
“முடிந்தவரை மனித பேச்சு அங்கீகாரத்தை உருவாக்க நாங்கள் வேலை செய்தோம். இது நிறைய வேலை” என்று ஃபாக்ஸ் கூறினார். அவர் 2022 இல் அந்த பீடபூமியை அடைய எதிர்பார்க்கிறார்.
அவர் தங்கள் தயாரிப்புகளில் பேச்சு அங்கீகாரத்தை இணைத்து அதை எளிதாக வாங்கும் நிறுவனங்களை குறிவைத்தார். வாடிக்கையாளர்கள் பயன்பாட்டிற்கு ஏற்ப பணம் செலுத்துகிறார்கள்; ஆடியோ டிரான்ஸ்கிரிப்ட் செய்யப்பட்ட ஒவ்வொரு வினாடிக்கும், சட்டசபை AI ஒரு பைசாவின் ஒரு பகுதியை வசூலிக்கிறது. வாடிக்கையாளர்களுக்கு மாதந்தோறும் கட்டணம் வசூலிக்கப்படுகிறது. ஒரு வாடிக்கையாளர் மாதம் 10 மணிநேரம் பயன்படுத்தினால், அதற்கு ஒன்பது டாலர்கள் செலவாகும். ஒரு வாடிக்கையாளர் மாதத்திற்கு ஒரு மில்லியன் மணிநேரத்தைப் பயன்படுத்தினால், அதற்கு சுமார் $900,000 செலவாகும்.
குரல் அங்கீகாரம் ஒரு சூடான சந்தை. “நிறைய புதிய தொடக்கங்கள் தொடங்கப்படுகின்றன,” என்று ஃபாக்ஸ் கூறினார், வாய்ப்புகளை வழங்குகிறது. “பல உற்சாகமான புதிய வணிகங்கள் குரல் தரவு மூலம் கட்டமைக்கப்படுகின்றன.”
அசெம்ப்ளிஏஐயின் தயாரிப்பு, வெறுக்கத்தக்க பேச்சு மற்றும் அவதூறு போன்ற முக்கியமான தலைப்புகளைக் கண்டறிய முடியும், எனவே வாடிக்கையாளர்கள் மனித உள்ளடக்க மதிப்பீட்டில் சேமிக்க முடியும்.
BMW, Apple மற்றும் Facebook போன்ற நிறுவனங்களின் அனுபவத்துடன், “நாங்கள் ஆழ்ந்த கற்றல் ஆராய்ச்சியாளர்களின் அனுபவம் வாய்ந்த குழுவாக இருக்கிறோம்” என்று ஃபாக்ஸ் தனது தொழில்நுட்பத்தை வேறுபடுத்துவதை விவரிக்குமாறு கேட்டுள்ளார். “பாரம்பரிய இயந்திர கற்றல் அணுகுமுறையைக் காட்டிலும் மிகவும் துல்லியமான அங்கீகார முடிவுகளைக் கொண்ட மிகப் பெரிய, மிகத் துல்லியமான ஆழமான கற்றல் மாதிரிகளை நாங்கள் உருவாக்குகிறோம். மேம்பட்ட நரம்பியல் நெட்வொர்க் தொழில்நுட்பங்களைப் பயன்படுத்தி பெரிய மாதிரிகளை உருவாக்குகிறோம்.” அதன் GPT-3 பெரிய மொழி மாதிரியை உருவாக்க OpenAI பயன்படுத்தும் அணுகுமுறையை அவர் ஒப்பிட்டார்.
கூடுதலாக, ஆடியோ மற்றும் வீடியோ உள்ளடக்கத்தின் தேடக்கூடிய மற்றும் அட்டவணைப்படுத்தக்கூடிய சுருக்கங்களை வழங்க டிரான்ஸ்கிரிப்ஷன்களின் மேல் AI அம்சங்களை உருவாக்குகின்றன. “இது படியெடுப்பதற்கு அப்பாற்பட்டது” என்று ஃபாக்ஸ் கூறினார்.
நிறுவனம் தற்போது 25 பேரை பணியமர்த்துகிறது மற்றும் நான்கு மாதங்களில் இரட்டிப்பாகும் என்று எதிர்பார்க்கிறது. வியாபாரம் நன்றாக இருந்தது. “ஆன்லைனில் ஆடியோ மற்றும் வீடியோ தரவுகளின் வெடிப்பு உள்ளது மற்றும் வாடிக்கையாளர்கள் அதைப் பயன்படுத்திக் கொள்ள விரும்புகிறார்கள், எனவே நாங்கள் அதிக தேவையைப் பார்க்கிறோம்,” என்று ஃபாக்ஸ் கூறினார்.
இல் மேலும் அறிக AI சட்டசபை.










Leave a Reply