Google యొక్క టెక్స్ట్-టు-ఇమేజ్ AI “ఫోటోరియలిస్టిక్ ఇమేజ్లను” అందించగలదు

AI మళ్లీ సాంకేతిక ప్రపంచంలో దృష్టి కేంద్రీకరించిన యుగంలో, Google దాని టెక్స్ట్-టి-ఇమేజ్ AI జనరేటర్తో ముందుకు వచ్చింది, ఇది మీకు టెక్స్ట్ ఇన్పుట్ ఆధారంగా చిత్రాలను అందించగలదు. ఇది ఇమేజెన్ AI సిస్టమ్, ఇది Google బ్రెయిన్ బృందంచే సృష్టించబడింది మరియు Google మరియు నమూనా చిత్రాల సమూహాన్ని విశ్వసిస్తే, అది ” ఉత్పత్తి చేయగలదు “ఫోటోరియలిస్టిక్ చిత్రాలు మరియు భాషా అవగాహన యొక్క లోతైన స్థాయి.” ఇక్కడ వివరాలు చూడండి.
ఇమేజెన్ AI ఏమి చేయగలదో ఇక్కడ ఉంది!
పేరు సూచించినట్లుగా, ఉద్యోగం కష్టం కాదు. మీరు చేయాల్సిందల్లా మీరు చూడాలనుకుంటున్నది టైప్ చేయండి మరియు డేటా లోడ్లను చదివిన తర్వాత దాని అవగాహన ఆధారంగా, Imagen మీ కోసం ఒక చిత్రాన్ని రూపొందిస్తుంది.
ఇమేజెన్ వెబ్సైట్ కొన్ని వినియోగ సందర్భాలను ప్రదర్శిస్తుంది మరియు మనం చూసేది చాలా ఆకట్టుకుంటుంది. ఇమేజెన్ మిళితం చేస్తుంది అధిక-నాణ్యత చిత్రాలను రూపొందించడానికి టెక్స్ట్ మరియు డిఫ్యూజన్ మోడల్లను అర్థం చేసుకోవడంలో పెద్ద ట్రాన్స్ఫార్మర్ భాషా నమూనాలు.

అవుట్పుట్లు చాలా ఖచ్చితమైనవిగా కనిపిస్తాయి మరియు OpenAI యొక్క ప్రసిద్ధ DALL-E వంటి ఇతర టెక్స్ట్-టు-ఇమేజ్ AI మోడల్లకు గట్టి పోటీనిస్తాయి (దీనిలో కూడా వారసుడు), VQ-GAN+CLIP, మరియు లాటెంట్ డిఫ్యూజన్ మోడల్స్. Google వద్ద కూడా రుజువు ఉంది. ఇది దీని కోసం DrawBench అనే బెంచ్మార్క్ సాధనాన్ని పరిచయం చేసింది మరియు దాని డేటా ఇమేజ్ని ఉత్తమమైనదిగా గ్రహిస్తుంది.

COCOలో, ఇమేజెన్ 7.27 COCO FIDని సాధించగలిగిందని మరియు మానవ రేటర్లు ఫలితాలను కనుగొన్నారని Google కూడా వెల్లడించింది.సూచన చిత్రాలతో సమానంగా.”
కానీ అటువంటి AI సిస్టమ్ల ద్వారా అందించబడిన నమూనా చిత్రాలు తరచుగా ఉత్తమమైనవిగా పరిగణించబడుతున్నాయని మరియు వికృతంగా ఉండేవి కర్టెన్ల వెనుక బాగానే ఉంటాయని మీరు తెలుసుకోవాలి. కాబట్టి, Google యొక్క AI మోడల్ను ఉత్తమమైనదిగా పరిగణించడం చాలా తొందరగా ఉంటుంది.
AI మోడల్లో దాని హెచ్చరికల సెట్ కూడా ఉంది, వీటిని Google హైలైట్ చేయకుండా ఉండదు. అవమానకరమైన కంటెంట్ లేదా నకిలీ చిత్రాలను సృష్టించడం వంటి హానికరమైన కార్యకలాపాలకు AI ఒక సాధనంగా ఉపయోగించబడుతుంది మరియు అందువల్ల ఇది ప్రజలు ప్రయత్నించడానికి ఇప్పటికీ అందుబాటులో లేదు. అదనంగా, AI వివిధ సామాజిక పక్షపాతాలకు గురవుతుంది.
ది Imagen వెబ్సైట్ చదువుతుంది,”వ్యక్తులను వర్ణించే చిత్రాలను రూపొందించేటప్పుడు ఇమేజెన్ తీవ్రమైన పరిమితులను ప్రదర్శిస్తుంది. వ్యక్తులను చిత్రీకరించని చిత్రాలపై మూల్యాంకనం చేసినప్పుడు ఇమేజెన్ గణనీయంగా అధిక ప్రాధాన్యత రేట్లను పొందుతుందని మా మానవ మూల్యాంకనాలు కనుగొన్నాయి, ఇది చిత్ర విశ్వసనీయతలో క్షీణతను సూచిస్తుంది. ప్రాథమిక అంచనా కూడా ఇమేజెన్ అనేక సామాజిక పక్షపాతాలు మరియు మూస పద్ధతులను ఎన్కోడ్ చేస్తుందని సూచిస్తుంది, ఇందులో తేలికపాటి చర్మపు రంగులు ఉన్న వ్యక్తుల చిత్రాలను రూపొందించడంలో మొత్తం పక్షపాతం మరియు పాశ్చాత్య లింగ మూస పద్ధతులకు అనుగుణంగా వివిధ వృత్తులను చిత్రీకరించే చిత్రాల ధోరణి.”
అందువల్ల, సరిగ్గా పని చేయడానికి ఇమేజెన్కి ఇంకా కొంత పని అవసరమని చెప్పడం సురక్షితం. ఏది ఏమైనప్పటికీ, సరదా విషయానికి వస్తే, ఇమేజెన్ చాలా మంచి ఎంపికగా అనిపిస్తుంది మరియు మీరు ఏదైనా గూఫీ మరియు అవాస్తవంగా చూడాలనుకుంటే, ఇమేజెన్ సహాయపడవచ్చు. Google యొక్క టెక్స్ట్-టు-ఇమేజ్ AI గురించి మీ ఆలోచనలు ఏమిటి? దిగువ వ్యాఖ్యలలో మాకు తెలియజేయండి.
Source link




