El gestor de recursos distribuïts Grid Engine és el sistema de gestió de cues de treballs semblat als seus competidors Platform LSF o PBSPro.
Un gestor de recursos distribuïts permet que diversos usuaris, grups i projectes puguen treballar junts usant una infraestructura compartida com, per exemple, un cluster de computació d'alt rendimientio.
A l'entorn de Grid Engine l'existència de cues no té molta importància per a l'usuari. L'usuari simplement ha d'especificar els recursos que requereix el seu treball i Grid Engine s'ocupa a col·locar-ho en la cua de treballs més adequada.
Funcionament
El funcionament principal de Grid Engine ho podem resumir en els següents punts:
Posa treballs en cues i planifica la seua execució.
Quadra treballs amb el node d'execució més apropiat.
Gestiona recursos (llicències de programari, etc.).
Fa complir les polítiques d'assignació de treballs (projecte A és més important que projecte B.)
Per a l'usuari que mana un treball, el sistema Grid Engine fa el següent:
1) Acceptar la sol·licitud d'executar un treball (job) de l'usuari.
2) Ficar el treball en un àrea pendent (cua).
3) Mana el treball des de l'àrea pendent al node més adequat.
4) Gestiona el treball mentre s'executa.
5) Retorna els resultats i guarda la informació sobre l'execució (accounting) en quan acabe el treball.
Uns exemples de requeriments de recursos d'un treball poden ser:
El treball requereix una llicència de programari.
El treball prefereix un node amb una gran quantitat memòria.
Un treball requereix un node amb una gran quantitat de memòria.