ਮਲਟੀਮੋਡਲ ਏਆਈ ਟੂਲ, ਇੱਕ ਵਾਰ ਯੂਨੀਮੋਡਲ ਇਨਪੁਟ ਕਾਰਜਾਂ ਤੱਕ ਸੀਮਤ, ਮਹੱਤਵਪੂਰਨ ਤੌਰ 'ਤੇ ਵਿਕਸਤ ਹੋਏ ਹਨ, ਟੈਕਸਟ, ਚਿੱਤਰ, ਵੀਡੀਓ ਅਤੇ ਆਡੀਓ ਨੂੰ ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਆਪਣੀਆਂ ਸਮਰੱਥਾਵਾਂ ਨੂੰ ਵਧਾਉਂਦੇ ਹੋਏ। ਮਾਰਕਿਟ ਅਤੇ ਮਾਰਕਿਟ ਖੋਜ ਦੇ ਅਨੁਸਾਰ, ਗਲੋਬਲ ਮਲਟੀਮੋਡਲ ਏਆਈ ਮਾਰਕੀਟ 2023 ਵਿੱਚ $1 ਬਿਲੀਅਨ ਤੋਂ ਵਧ ਕੇ 2028 ਤੱਕ $4.5 ਬਿਲੀਅਨ ਤੱਕ ਪਹੁੰਚਣ ਦਾ ਅਨੁਮਾਨ ਹੈ, ਜੋ ਇਹਨਾਂ ਸਾਧਨਾਂ ਦੀ ਵੱਧ ਰਹੀ ਮਹੱਤਤਾ ਨੂੰ ਉਜਾਗਰ ਕਰਦਾ ਹੈ। ਵਿਕਲਪਾਂ ਦੀ ਵਿਸਤ੍ਰਿਤ ਸ਼੍ਰੇਣੀ ਵਿੱਚ ਨੈਵੀਗੇਟ ਕਰਨਾ ਚੁਣੌਤੀਪੂਰਨ ਹੋ ਸਕਦਾ ਹੈ, ਇਸ ਲਈ ਆਓ 2024 ਲਈ ਪੰਜ ਸਰਵੋਤਮ ਮਲਟੀਮੋਡਲ AI ਟੂਲਸ ਦੀ ਪੜਚੋਲ ਕਰੀਏ।
1. ਗੂਗਲ ਜੈਮਿਨੀ
ਗੂਗਲ ਜੈਮਿਨੀ, ਇੱਕ ਮੂਲ ਰੂਪ ਵਿੱਚ ਮਲਟੀਮੋਡਲ ਲੈਂਗੂਏਜ ਮਾਡਲ , ਇੱਕ ਬਹੁਮੁਖੀ ਟੂਲ ਦੇ ਰੂਪ ਵਿੱਚ ਵੱਖਰਾ ਹੈ ਜੋ ਟੈਕਸਟ, ਚਿੱਤਰ, ਵੀਡੀਓ, ਕੋਡ, ਅਤੇ ਆਡੀਓ ਦੀ ਪਛਾਣ ਕਰਨ ਅਤੇ ਬਣਾਉਣ ਦੇ ਸਮਰੱਥ ਹੈ। ਤਿੰਨ ਸੰਸਕਰਣਾਂ ਵਿੱਚ ਵੰਡਿਆ ਗਿਆ ਹੈ—ਜੇਮਿਨੀ ਅਲਟਰਾ, ਜੈਮਿਨੀ ਪ੍ਰੋ, ਅਤੇ ਜੇਮਿਨੀ ਨੈਨੋ—ਹਰੇਕ ਖਾਸ ਉਪਭੋਗਤਾ ਦੀਆਂ ਜ਼ਰੂਰਤਾਂ ਨੂੰ ਪੂਰਾ ਕਰਦੇ ਹਨ। ਜੈਮਿਨੀ ਅਲਟਰ, ਸਭ ਤੋਂ ਵੱਡਾ ਐਲ ਐਲ ਐਮ, ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਉੱਤਮ ਹੈ, 32 ਵਿੱਚੋਂ 30 ਬੈਂਚਮਾਰਕਾਂ 'ਤੇ ਜੀਪੀਟੀ ੪ਵੀ ਨੂੰ ਪਛਾੜਦਾ ਹੈ, ਜਿਵੇਂ ਕਿ ਡੇਮਿਸ ਹੈਸਾਬੀਸ, ਸੀਈਓ, ਅਤੇ ਗੂਗਲ ਡੀਪਮਾਇਡ ਦੇ ਸਹਿ-ਸੰਸਥਾਪਕ ਦੁਆਰਾ ਸਾਂਝਾ ਕੀਤਾ ਗਿਆ ਹੈ।
2. ਚੈਟਜੀਪੀਟੀ (ਜਈਪਈਟਈ ੪ਵੀ)
ਚੈਟਜੀਪੀਟੀ, ਜੀਪੀਟੀ-4ਵੀ ਵਿਦ ਵਿਜ਼ਨ ਦੁਆਰਾ ਸੰਚਾਲਿਤ, ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਟੈਕਸਟ ਅਤੇ ਚਿੱਤਰਾਂ ਨੂੰ ਇਨਪੁਟ ਕਰਨ ਦੀ ਆਗਿਆ ਦੇ ਕੇ ਮਲਟੀਮੋਡੈਲਿਟੀ ਪੇਸ਼ ਕਰਦਾ ਹੈ। ਨਵੰਬਰ 2023 ਤੱਕ ਪ੍ਰਭਾਵਸ਼ਾਲੀ 100 ਮਿਲੀਅਨ ਹਫਤਾਵਾਰੀ ਸਰਗਰਮ ਉਪਭੋਗਤਾਵਾਂ ਦੇ ਨਾਲ, ਚੈਟਜੀਪੀਟੀ ਪ੍ਰੋਂਪਟ ਵਿੱਚ ਟੈਕਸਟ, ਵੌਇਸ ਅਤੇ ਚਿੱਤਰਾਂ ਦੇ ਮਿਸ਼ਰਣ ਦਾ ਸਮਰਥਨ ਕਰਦਾ ਹੈ, ਅਤੇ ਪੰਜ ਤੱਕ ਏਆਈ ਦੁਆਰਾ ਤਿਆਰ ਕੀਤੀਆਂ ਆਵਾਜ਼ਾਂ ਵਿੱਚ ਜਵਾਬ ਦਿੰਦਾ ਹੈ। ਜੀਪੀਟੀ ੪ਵੀ ਵੇਰੀਐਂਟ ਸਭ ਤੋਂ ਵੱਡੇ ਮਲਟੀਮੋਡਲ ਏਆਈ ਟੂਲਸ ਵਿੱਚੋਂ ਇੱਕ ਹੈ, ਇੱਕ ਵਿਆਪਕ ਉਪਭੋਗਤਾ ਅਨੁਭਵ ਦੀ ਪੇਸ਼ਕਸ਼ ਕਰਦਾ ਹੈ।
3. ਵਿਸ਼ਵ ਏ.ਆਈ
ਵਰਲਡ ਏਆਈ ਵਿੱਚ, ਇੱਕ ਅੱਖਰ ਇੰਜਣ, ਡਿਵੈਲਪਰਾਂ ਨੂੰ ਡਿਜੀਟਲ ਦੁਨੀਆ ਲਈ ਗੈਰ-ਖੇਡਣ ਯੋਗ ਅੱਖਰ (ਐਨਪੀਐਸ) ਅਤੇ ਵਰਚੁਅਲ ਸ਼ਖਸੀਅਤਾਂ ਬਣਾਉਣ ਲਈ ਸ਼ਕਤੀ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਮਲਟੀਮੋਡਲ ਏਆਈ ਦਾ ਲਾਭ ਉਠਾਉਂਦੇ ਹੋਏ, ਵਿਸ਼ਵ ਵਿੱਚ ਏਆਈ ਐਨਪੀਐਸ ਨੂੰ ਕੁਦਰਤੀ ਭਾਸ਼ਾ, ਆਵਾਜ਼, ਐਨੀਮੇਸ਼ਨਾਂ ਅਤੇ ਭਾਵਨਾਵਾਂ ਰਾਹੀਂ ਸੰਚਾਰ ਕਰਨ ਦੇ ਯੋਗ ਬਣਾਉਂਦਾ ਹੈ। ਡਿਵੈਲਪਰ ਡਿਜੀਟਲ ਤਜ਼ਰਬਿਆਂ ਦੀ ਇਮਰਸਿਵ ਗੁਣਵੱਤਾ ਨੂੰ ਵਧਾਉਂਦੇ ਹੋਏ, ਖੁਦਮੁਖਤਿਆਰੀ ਕਾਰਵਾਈਆਂ, ਵਿਲੱਖਣ ਸ਼ਖਸੀਅਤਾਂ, ਭਾਵਨਾਤਮਕ ਪ੍ਰਗਟਾਵੇ, ਅਤੇ ਪਿਛਲੀਆਂ ਘਟਨਾਵਾਂ ਦੀਆਂ ਯਾਦਾਂ ਨਾਲ ਸਮਾਰਟ ਐਨਪੀਐਸ ਤਿਆਰ ਕਰ ਸਕਦੇ ਹਨ।
4. ਮੈਟਾ ਚਿੱਤਰ ਬੰਨ੍ਹ
ਮੈਟਾ ਇਮੇਜ ਬਾਇੰਡ, ਇੱਕ ਓਪਨ-ਸੋਰਸ ਮਲਟੀਮੋਡਲ ਏਆਈ ਮਾਡਲ, ਟੈਕਸਟ, ਆਡੀਓ, ਵਿਜ਼ੂਅਲ, ਮੂਵਮੈਂਟ, ਥਰਮਲ, ਅਤੇ ਡੂੰਘਾਈ ਡੇਟਾ ਦੀ ਪ੍ਰਕਿਰਿਆ ਦੁਆਰਾ ਵੱਖਰਾ ਹੈ। ਛੇ ਰੂਪਾਂ ਵਿੱਚ ਜਾਣਕਾਰੀ ਨੂੰ ਜੋੜਨ ਦੇ ਸਮਰੱਥ ਪਹਿਲੇ AI ਮਾਡਲ ਦੇ ਰੂਪ ਵਿੱਚ, ਚਿੱਤਰ ਬਾਇੰਡ ਵੱਖ-ਵੱਖ ਇਨਪੁਟਸ, ਜਿਵੇਂ ਕਿ ਇੱਕ ਕਾਰ ਇੰਜਣ ਦਾ ਆਡੀਓ ਅਤੇ ਇੱਕ ਬੀਚ ਦੀ ਇੱਕ ਤਸਵੀਰ ਨੂੰ ਮਿਲਾ ਕੇ ਕਲਾ ਬਣਾਉਂਦਾ ਹੈ।
5. ਰਨਵੇ ਜਨਰਲ -2
ਰਨਵੇ ਜਨਰਲ -2 ਵੀਡੀਓ ਜਨਰੇਸ਼ਨ ਵਿੱਚ ਮੁਹਾਰਤ ਵਾਲੇ ਇੱਕ ਬਹੁਮੁਖੀ ਮਲਟੀਮੋਡਲ ਏਆਈ ਮਾਡਲ ਦੇ ਤੌਰ 'ਤੇ ਸੈਂਟਰ ਪੜਾਅ ਲੈਂਦਾ ਹੈ। ਇਹ ਟੈਕਸਟ, ਚਿੱਤਰ, ਜਾਂ ਵੀਡੀਓ ਇਨਪੁਟ ਨੂੰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ, ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਟੈਕਸਟ-ਟੂ-ਵੀਡੀਓ, ਚਿੱਤਰ-ਤੋਂ-ਵੀਡੀਓ, ਅਤੇ ਵੀਡੀਓ-ਤੋਂ-ਵੀਡੀਓ ਕਾਰਜਕੁਸ਼ਲਤਾਵਾਂ ਦੁਆਰਾ ਅਸਲੀ ਵੀਡੀਓ ਸਮੱਗਰੀ ਬਣਾਉਣ ਦੀ ਆਗਿਆ ਦਿੰਦਾ ਹੈ। ਉਪਭੋਗਤਾ ਮੌਜੂਦਾ ਚਿੱਤਰਾਂ ਜਾਂ ਪ੍ਰੋਂਪਟਾਂ ਦੀ ਸ਼ੈਲੀ ਦੀ ਨਕਲ ਕਰ ਸਕਦੇ ਹਨ, ਵੀਡੀਓ ਸਮੱਗਰੀ ਨੂੰ ਸੰਪਾਦਿਤ ਕਰ ਸਕਦੇ ਹਨ, ਅਤੇ ਉੱਚ ਵਫ਼ਾਦਾਰੀ ਦੇ ਨਤੀਜੇ ਪ੍ਰਾਪਤ ਕਰ ਸਕਦੇ ਹਨ, ਜਿਸ ਨਾਲ ਜਨਰਲ -2 ਨੂੰ ਰਚਨਾਤਮਕ ਪ੍ਰਯੋਗਾਂ ਲਈ ਇੱਕ ਆਦਰਸ਼ ਵਿਕਲਪ ਬਣਾਇਆ ਜਾ ਸਕਦਾ ਹੈ।
-
ਵਿਜੈ ਗਰਗ, ਰਿਟਾਇਰਡ ਪ੍ਰਿੰਸੀਪਲ ਐਜੂਕੇਸ਼ਨਲ ਕਾਲਮਨਿਸਟ ਮਲੋਟ
vkmalout@gmail.com
Disclaimer : The opinions expressed within this article are the personal opinions of the writer/author. The facts and opinions appearing in the article do not reflect the views of Babushahi.com or Tirchhi Nazar Media. Babushahi.com or Tirchhi Nazar Media does not assume any responsibility or liability for the same.