حال ہی میں، گوگل نئے AI آلات پر کام کر رہا ہے جو تحریری مواد اور یوٹیوب ویڈیوز کو آڈیو یا پوڈکاسٹ میں تبدیل کرتے ہیں، جس سے محققین کو ان کی تعلیم میں مدد ملتی ہے۔ ایک آلہ، جس پر کام ہو رہا ہے، ایلومی نیٹ ہے، جو طویل تحقیقاتی مقالے اور کتابوں کو مختصر AI کے بنائے ہوئے آڈیو مباحثوں میں تبدیل کرتا ہے۔ گوگل اسے "تجربی تکنیک کے طور پر بیان کرتا ہے جو AI کو آپ کی تعلیمی ترجیحات کے مطابق بنانے کے لئے استعمال کرتی ہے۔" ایلومی نیٹ، گوگل کے نوٹ بک ایل ایم کی طرح ہے، یہ ایک AI نوٹ بک ہے جو بڑے زبان کے ماڈل کو صارف کے نوٹس مثلاً PDF، ویب سائٹ اور ویڈیوز کے ساتھ جوڑ کر بہتر سمجھ بوجھ فراہم کرتی ہے۔ جہاں دونوں آڈیو مباحثے تیار کرتے ہیں، وہاں ایلومی نیٹ کو زیادہ تکنیکی مواد کے لئے ڈیزائن کیا گیا ہے۔ ایلومی نیٹ AI کا استعمال کرتے ہوئے شائع شدہ مقالوں کو آڈیو مباحثوں میں تبدیل کرتا ہے جس میں دو AI آوازیں اہم نکات کا خلاصہ پیش کرتی ہیں۔ فی الحال، یہ کمپیوٹر سائنس کے علمی مقالوں کے لئے بہتر بنایا گیا ہے۔ ایلومی نیٹ کا تجربہ کرنے کے لئے، میں نے اپنے گوگل اکاؤنٹ کے ساتھ لاگ ان کیا اور ٹیکنالوجی مقالوں کے PDF لنکس اپلوڈ کیے۔ ایلومی نیٹ کی سائٹ پر، میں نے ایک مقالہ "Mind the Gap: Foundation Models and the Covert Proliferation of Military Intelligence, Surveillance, and Targeting" اپلوڈ کیا۔ گوگل نوٹ کرتا ہے کہ "ایلومی نیٹ ویب مواد کے لئے دستیاب ہے، پیوال مواد اور AI کے انڈکسنگ سے آپٹ آؤٹ کرنے والی سائٹوں کے علاوہ۔ مختلف طریقے جیسے فائل اپلوڈ، مواد داخل کرنے کے لئے متوقع ہیں۔" اپلوڈ کرنے کے بعد، میں نے ایک رسمی آڈیو گفتگو کی طرز کا انتخاب کیا (آپشنز میں آرام دہ، آزادانہ، رہنمائی شدہ، یا رسمی شامل ہیں)۔ میں نے جنریٹ کو دبایا اور 15 صفحوں کے مقالہ کو آڈیو گفتگو میں تبدیل ہونے کے لئے تقریباً ایک منٹ انتظار کیا۔ جب تیار ہو گیا، تو میں سنتا ہوں اور اسے اپنی لائبریری میں محفوظ کرتا ہوں۔ نوٹ کریں، "آڈیو گفتگوئیں 30 دن کے بعد حذف ہو جاتی ہیں جب تک کہ آپ کی لائبریری میں محفوظ نہ ہوں۔" مائی لائبریری سیکشن میں ذاتی اور عوامی آڈیو گفتگوئیں شامل ہیں۔ آپ گفتگو کے ٹرانسکرپٹس دیکھ سکتے ہیں اور شیئر آئیکن کے استعمال سے انہیں شیئر کر سکتے ہیں۔ آڈیو گفتگو نے مقالہ کے اہم موضوعات کو موثر طور پر اجاگر کیا اور بہت حقیقی لگا، جیسے کسی محبوب ٹیک پوڈکاسٹ کو سن رہے ہوں۔ ایلومی نیٹ محققین، طلباء، اور مصنفین کے لئے ایک قیمتی ٹول ہو سکتا ہے جو طویل تحقیقاتی مقالوں سے نمٹتے ہیں۔ یہ ان لوگوں کے لئے محقق معاون کے طور پر کام کرتا ہے جو اہم نکات پر توجہ مرکوز کرنے میں مدد چاہتے ہیں۔ پچھلی پانچ آڈیو تیاریاں کی حد اب 19 فی دن کی گئی ہے۔ ایلومی نیٹ تک رسائی کیسے حاصل کی جائے؟
آج کل، غیر مقامی انگریزی بولنے والے اتنے روانی سے بولتے ہیں کہ ان کا لہجہ پہچاننا مشکل ہو سکتا ہے۔ تاہم، اگر آپ یہ یقین کر بیٹھے ہیں کہ آپ کا لہجہ ناقابل شناخت ہے، تو لہجہ اوریکل اس عقیدے کو کچھ حد تک پریشان کن انداز میں چیلنج کر سکتا ہے۔ لہجہ اوریکل کا تعارف لہجہ اوریکل ایک AI ٹول ہے جو بولڈوائس کے ذریعہ تیار کیا گیا ہے، جو کہ لہجے کی تربیت میں مہارت رکھنے والی کمپنی ہے۔ بولڈوائس ایک AI پر مبنی زبان سیکھنے کا پلیٹ فارم پیش کرتا ہے، جو الفاظ یا گرامر کی تدریس پر توجہ نہیں دیتا، بلکہ آپ کے امریکی لہجے کو بہتر بنانے پر مرکوز ہوتا ہے۔ اس کے برعکس، لہجہ اوریکل کا مختلف طریقہ ہے جو آپ کے لہجے کی شناخت کرتا ہے۔ یہ آپ کو پڑھنے کے لیے ایک مختصر اسکرپٹ فراہم کرتا ہے، پھر تیزی سے آپ کی آواز کا تجزیہ کرتے ہوئے آپ کے لہجے کا اندازہ لگاتا ہے۔ یہ ٹول غیر مقامی بولنے والوں کے وسیع ڈیٹا بیس کا استعمال کرتا ہے، جو اس سے آگے بڑھتا ہے جیسے "اگر وہ X کو Y کے طور پر تلفظ کرتے ہیں، تو وہ Z سے ہوں گے۔" یہ تقریر میں باریک تفصیلات اور نمونوں کا پتہ لگاتا ہے جنہیں شاید آپ بھی نظر انداز کر دیں۔ ظاہر ہے، مجھے اسے آزمانا ہی تھا۔ بطور ایک غیر مقامی انگریزی بولنے والا، میں اپنی روانی پر بہت فخر کرتا ہوں۔ میں نے کبھی رسمی اسباق نہیں لیے، پھر بھی میں آرام دہ انداز میں بات چیت کر سکتا ہوں۔ مجھے یہ دیکھنے میں دلچسپی تھی کہ اوریکل میرے لہجے کی کس طرح تعبیر کرے گا۔ جب اوریکل سب کچھ جانتا ہے میں نے ہیڈسیٹ پہنا، ایپ لانچ کی، اور "مجھ پر آزمائیں" پر کلک کیا۔ ایک مختصر اسکرپٹ میرے سامنے آیا جسے میں نے بلند آواز سے پڑھا۔ اپنی بہترین نیوز کاسٹر کی آواز کا استعمال کرتے ہوئے، میں نے ریکارڈنگ کی۔ جو لوگ دلچسپی رکھتے ہیں، میں نے اپنی ریکارڈنگ نیچے شامل کی ہے۔ سنیں اور اندازہ لگائیں کہ میں کہاں سے ہو سکتا ہوں اس سے پہلے کہ آپ آگے پڑھیں۔ یہاں اوریکل کا اندازہ ہے، اور بلا شبہ، یہ درست تھا۔ میں واقعی فارسی ہوں۔ اب تک، مجھے لگا کہ میرا لہجہ پہچان کے لیے بہت زیادہ غیر جانبدار ہے۔ سالوں پہلے، استنبول میں ایک دکان دار نے میرے لہجے کا اندازہ فارسی لگایا تھا، لیکن میں نے اسے خوش قسمتی کا گمان سمجھا۔ اوریکل کی تصدیق کے ساتھ، میں اپنے مؤقف پر دوبارہ غور کر رہا ہوں۔ حقیقی حیرت نتیجہ کے نیچے تفصیلی تجزیہ تھی۔ بظاہر، میرے لہجے میں 17% ترکی اثر پایا جاتا ہے۔ میں چاہ کر بھی ترک لہجہ کی نقل نہیں کر سکتا، پھر بھی لگتا ہے میری آواز کسی نہ کسی طرح میری وراثت کے پہلوؤں کو ظاہر کرتی ہے۔ یہ خوفناک ہے۔ اوریکل نے نہ صرف میرے لہجے کی شناخت کی بلکہ یہ ایک DNA ٹیسٹ کی طرح میرے نسب میں جھانک آیا۔ اگر آپ کے لہجے کی تاثر کے بارے میں جاننے میں دلچسپی رکھتے ہیں - یا بس تھوڑا سا لطف اٹھانا چاہتے ہیں - تو لہجہ اوریکل کو آزمائیں۔ آپ اپنے شناخت کے پوشیدہ پہلو کو ایک وقت میں ایک صوتی درستگی کے ذریعے دریافت کر سکتے ہیں۔
حالیہ ترقی پسندوں کی کانفرنس اور 250 انجینئرز کے ساتھ ایک کال میں، "AI" کے بار بار ذکر نے نمایاں ناراضگی اور مزاحیہ ردِ عمل پیدا کیا۔ مسئلہ AI خود نہیں بلکہ اس کو ایک جامع حل کی حیثیت سے دیکھنے کا ہے، بغیر عملی تناظر کے۔ ڈویلپرز اور انجینئرز چاہتے ہیں کہ AI کو حقیقی زندگی کی ایپلیکیشنز میں بے داغ طریقے سے شامل کیا جائے، نہ کہ صرف چرچا کیا جائے۔ حالیہ برسوں میں، AI خاموشی سے زندگی کا حصہ بن چکا ہے، جیسے AI پیدا شدہ سرچ خلاصوں کے ذریعے کاموں کو آسان بنانا۔ ڈویلپرز کی خواہش ہے کہ AI "بورنگ" ہو — یعنی موجودہ بنیادی ڈھانچے میں مؤثر طریقے سے کام کرے بغیر کسی مستقل ہنگامے کے۔ اوپن سورس پروجیکٹس جیسے RamaLama اس کی مثال ہیں، جو OCI کنٹینرز کا استعمال کرتے ہوئے AI انضمام کو آسان بناتے ہیں، GPU یا CPU کی حمایت کرکے پیچیدہ ترتیبات کو ختم کرتے ہیں۔ جبکہ پروجیکٹس جیسے Ollama لوکل AI سیٹ اپ میں مدد کرتے ہیں، RamaLama کنٹینرز میں پروڈکشن ڈپلائمنٹ کی سہولت فراہم کرتے ہیں، جو پورٹیبلٹی اور عملی واقعت کا اضافہ کرتے ہیں۔ وسیع زبان کے ماڈلز کے ماضی کے ہائپ کے باوجود، اب چھوٹے، زیادہ متعلقہ ماڈلز کی طرف رجحان ہے۔ یہ ماڈلز، بزنس ضروریات کے مطابق، شفافیت اور عملی افادیت کو فروغ دیتے ہیں۔ CEOs جیسے Matt Hicks آف Red Hat روز مرہ کی ضروریات کے لئے قابل رسائی اور کارآمد ماڈلز کی وکالت کرتے ہیں۔ AI ماڈلز، جو بنیادی طور پر ہاردوئیر پر چلنے والا سافٹ ویئر ہیں، Linux کنٹینرز سے فائدہ اٹھاتے ہیں، جو تجربات اور ڈیویلپمنٹ سے پروڈکشن کی محفوظ منتقلی کو بغیر ڈیٹا کے خطرے کے ممکن بناتے ہیں۔ جو تنظیمیں پہلے ہی کنٹینر ٹیکنالوجیز کو استعمال کر رہی ہیں، وہ AI کے لئے موجودہ انفراسٹرکچر کا فائدہ اٹھا سکتی ہیں، جو کہ اضافہ سکالیبلیٹی اور سیکیورٹی فراہم کرتی ہیں۔ جس طرح ویب اور کلاؤڈ ٹیکنالوجیز بے داغ طور پر شامل ہو گئیں، AI بھی ایسی ہی تبدیلی کے عمل سے گزر رہی ہے، جو ہائپ سے روزمرہ کے عملی استعمال کی جانب بڑھ رہی ہے۔
OpenAI کے o3 ماڈل نے AI میں ایک حیران کن پیشرفت کی ہے، جس نے ARC-AGI معیار پر 75
بہت سی نیوز آؤٹ لیٹس کے برعکس، پروسپیکٹ پوری طرح مفت، قابل رسائی صحافت فراہم کرنے کے لیے پرعزم ہے۔ ہم سمجھتے ہیں کہ آزاد صحافت جمہوریت کے لیے اہم ہے، پھر بھی معیاری رپورٹنگ کرنا مہنگا ہوتا ہے۔ آزاد پریس اور جمہوریت کو دھمکیاں، ٹرمپ سے لے کر مسک تک، 2025 میں ایسی حالت میں ہیں کہ ہمیں اپنی کوششوں کو روکنے کی صلاح نہیں۔ ہم ابھی $75,000 کی فنڈریزنگ کے ہدف سے پیچھے ہیں، جو آپ کی بھروسے والی باریکی سے تیار شدہ تحقیقاتی صحافت جاری رکھنے کے لیے ضروری ہے۔ آپ کی مدد ہماری آزادی برقرار رکھنے اور اہم کہانیوں کی گہرائی سے تحقیق میں معاون ہے۔ ہم آپ سے درخواست کرتے ہیں کہ آج ہی سال کے اختتام پر تعاون دیں۔ کسی بھی رقم سے ہمارا مستقبل محفوظ رہتا ہے اور یہ یقینی ہوتا ہے کہ ہم اقتدار میں رہنے والوں کو جوابدہ ٹھہرا سکیں۔ کیا آپ آزاد صحافت کے لیے پروسپیکٹ کو ڈونیشن دینے پر غور کریں گے؟
اس سال ٹیک انڈسٹری میں مصنوعی ذہانت کی نئی خصوصیات ابھری ہیں، جو جدید آئی فون سے گوگل کے Gemini جیسے چیٹ بوتس تک ہر چیز میں نظر آئیں۔ CNET کے ایڈیٹر اِن چیف، ایڈم آوریمہ، نے CBS نیوز 24/7 کے ساتھ ان ترقیات پر بات چیت کی۔
© 2024 فورچون میڈیا آئی پی لمیٹڈ.
- 1