Google యొక్క టెక్స్ట్-టు-ఇమేజ్ AI “ఫోటోరియలిస్టిక్ ఇమేజ్‌లను” అందించగలదు

0 1 minute read

AI మళ్లీ సాంకేతిక ప్రపంచంలో దృష్టి కేంద్రీకరించిన యుగంలో, Google దాని టెక్స్ట్-టి-ఇమేజ్ AI జనరేటర్‌తో ముందుకు వచ్చింది, ఇది మీకు టెక్స్ట్ ఇన్‌పుట్ ఆధారంగా చిత్రాలను అందించగలదు. ఇది ఇమేజెన్ AI సిస్టమ్, ఇది Google బ్రెయిన్ బృందంచే సృష్టించబడింది మరియు Google మరియు నమూనా చిత్రాల సమూహాన్ని విశ్వసిస్తే, అది ” ఉత్పత్తి చేయగలదు “ఫోటోరియలిస్టిక్ చిత్రాలు మరియు భాషా అవగాహన యొక్క లోతైన స్థాయి.” ఇక్కడ వివరాలు చూడండి.

ఇమేజెన్ AI ఏమి చేయగలదో ఇక్కడ ఉంది!

పేరు సూచించినట్లుగా, ఉద్యోగం కష్టం కాదు. మీరు చేయాల్సిందల్లా మీరు చూడాలనుకుంటున్నది టైప్ చేయండి మరియు డేటా లోడ్లను చదివిన తర్వాత దాని అవగాహన ఆధారంగా, Imagen మీ కోసం ఒక చిత్రాన్ని రూపొందిస్తుంది.

ఇమేజెన్ వెబ్‌సైట్ కొన్ని వినియోగ సందర్భాలను ప్రదర్శిస్తుంది మరియు మనం చూసేది చాలా ఆకట్టుకుంటుంది. ఇమేజెన్ మిళితం చేస్తుంది అధిక-నాణ్యత చిత్రాలను రూపొందించడానికి టెక్స్ట్ మరియు డిఫ్యూజన్ మోడల్‌లను అర్థం చేసుకోవడంలో పెద్ద ట్రాన్స్‌ఫార్మర్ భాషా నమూనాలు.

గూగుల్ ఇమేజ్ AI నమూనా చిత్రం — చిత్రం: ఇమేజెన్

అవుట్‌పుట్‌లు చాలా ఖచ్చితమైనవిగా కనిపిస్తాయి మరియు OpenAI యొక్క ప్రసిద్ధ DALL-E వంటి ఇతర టెక్స్ట్-టు-ఇమేజ్ AI మోడల్‌లకు గట్టి పోటీనిస్తాయి (దీనిలో కూడా వారసుడు), VQ-GAN+CLIP, మరియు లాటెంట్ డిఫ్యూజన్ మోడల్స్. Google వద్ద కూడా రుజువు ఉంది. ఇది దీని కోసం DrawBench అనే బెంచ్‌మార్క్ సాధనాన్ని పరిచయం చేసింది మరియు దాని డేటా ఇమేజ్‌ని ఉత్తమమైనదిగా గ్రహిస్తుంది.

google imagen AI డ్రాబెంచ్ ఫలితాలు — చిత్రం: ఇమేజెన్

COCOలో, ఇమేజెన్ 7.27 COCO FIDని సాధించగలిగిందని మరియు మానవ రేటర్లు ఫలితాలను కనుగొన్నారని Google కూడా వెల్లడించింది.సూచన చిత్రాలతో సమానంగా.”

కానీ అటువంటి AI సిస్టమ్‌ల ద్వారా అందించబడిన నమూనా చిత్రాలు తరచుగా ఉత్తమమైనవిగా పరిగణించబడుతున్నాయని మరియు వికృతంగా ఉండేవి కర్టెన్‌ల వెనుక బాగానే ఉంటాయని మీరు తెలుసుకోవాలి. కాబట్టి, Google యొక్క AI మోడల్‌ను ఉత్తమమైనదిగా పరిగణించడం చాలా తొందరగా ఉంటుంది.

AI మోడల్‌లో దాని హెచ్చరికల సెట్ కూడా ఉంది, వీటిని Google హైలైట్ చేయకుండా ఉండదు. అవమానకరమైన కంటెంట్ లేదా నకిలీ చిత్రాలను సృష్టించడం వంటి హానికరమైన కార్యకలాపాలకు AI ఒక సాధనంగా ఉపయోగించబడుతుంది మరియు అందువల్ల ఇది ప్రజలు ప్రయత్నించడానికి ఇప్పటికీ అందుబాటులో లేదు. అదనంగా, AI వివిధ సామాజిక పక్షపాతాలకు గురవుతుంది.

ది Imagen వెబ్‌సైట్ చదువుతుంది,”వ్యక్తులను వర్ణించే చిత్రాలను రూపొందించేటప్పుడు ఇమేజెన్ తీవ్రమైన పరిమితులను ప్రదర్శిస్తుంది. వ్యక్తులను చిత్రీకరించని చిత్రాలపై మూల్యాంకనం చేసినప్పుడు ఇమేజెన్ గణనీయంగా అధిక ప్రాధాన్యత రేట్లను పొందుతుందని మా మానవ మూల్యాంకనాలు కనుగొన్నాయి, ఇది చిత్ర విశ్వసనీయతలో క్షీణతను సూచిస్తుంది. ప్రాథమిక అంచనా కూడా ఇమేజెన్ అనేక సామాజిక పక్షపాతాలు మరియు మూస పద్ధతులను ఎన్‌కోడ్ చేస్తుందని సూచిస్తుంది, ఇందులో తేలికపాటి చర్మపు రంగులు ఉన్న వ్యక్తుల చిత్రాలను రూపొందించడంలో మొత్తం పక్షపాతం మరియు పాశ్చాత్య లింగ మూస పద్ధతులకు అనుగుణంగా వివిధ వృత్తులను చిత్రీకరించే చిత్రాల ధోరణి.”

అందువల్ల, సరిగ్గా పని చేయడానికి ఇమేజెన్‌కి ఇంకా కొంత పని అవసరమని చెప్పడం సురక్షితం. ఏది ఏమైనప్పటికీ, సరదా విషయానికి వస్తే, ఇమేజెన్ చాలా మంచి ఎంపికగా అనిపిస్తుంది మరియు మీరు ఏదైనా గూఫీ మరియు అవాస్తవంగా చూడాలనుకుంటే, ఇమేజెన్ సహాయపడవచ్చు. Google యొక్క టెక్స్ట్-టు-ఇమేజ్ AI గురించి మీ ఆలోచనలు ఏమిటి? దిగువ వ్యాఖ్యలలో మాకు తెలియజేయండి.

Source link